- Các loại xác suất hoặc lấy mẫu ngẫu nhiên
- Phương pháp lấy mẫu ngẫu nhiên đơn giản
- Lấy mẫu ngẫu nhiên có hệ thống
- Lấy mẫu ngẫu nhiên phân tầng
- Lấy mẫu theo cụm ngẫu nhiên
- Các kiểu lấy mẫu phi xác suất
- Lấy mẫu thuận tiện
- Lấy mẫu hạn ngạch
- Chọn mẫu bóng tuyết
- Lấy mẫu tùy ý
- Người giới thiệu
Các kiểu lấy mẫu là những cách khác nhau để trích xuất dữ liệu từ một phần của tổng số, một công cụ thống kê mạnh mẽ có chức năng xác định phần nào của dân số hoặc vũ trụ cần thiết để kiểm tra, để đưa ra suy luận và thu thập thông tin về phần đó.
Lấy mẫu là rất quan trọng khi bạn không thể hoặc không muốn phân tích toàn bộ tổng thể. Lưu ý rằng thuật ngữ "dân số" không chỉ đề cập đến một nhóm lớn người hoặc sinh vật sống, mà nói chung cho tổng số các yếu tố sẽ được nghiên cứu trong một vấn đề nhất định.
Hình 1. Việc lấy mẫu là quan trọng để chọn một mẫu đại diện từ vũ trụ. Nguồn: Pixabay.
Theo kiểu chọn mẫu được chọn, phần của quần thể được coi là đại diện nhất sẽ được chọn, luôn phù hợp với các mục tiêu.
Tất nhiên, khi chỉ lấy một phần của vũ trụ dữ liệu, có thể bỏ sót một số chi tiết và bỏ sót thông tin, đó là lý do tại sao kết quả sẽ không chính xác như mong muốn. Đây được gọi là lỗi lấy mẫu.
Ý tưởng là đơn giản hóa vũ trụ dữ liệu càng nhiều càng tốt, chọn mẫu đại diện nhất có khả năng cung cấp thông tin tối đa, để đảm bảo tính hợp lệ của kết quả.
Các loại xác suất hoặc lấy mẫu ngẫu nhiên
Lấy mẫu theo xác suất dựa trên xác suất mà các đối tượng của mẫu phải được chọn. Theo cách này, mỗi phần tử của tổng thể có cơ hội được chọn đã biết, tất nhiên phải lớn hơn 0.
Điều này cực kỳ quan trọng, bởi vì có thể xảy ra rằng từ một vũ trụ dữ liệu, một mẫu đã được chọn không đủ đại diện cho toàn bộ.
Nếu vậy, kết quả sẽ bị sai lệch, vì một số bộ phận dân cư sẽ được ưu ái hơn những bộ phận khác. Để tránh sai lệch, trong số đó có một số loại, một tùy chọn là để cho cơ hội chọn mẫu và do đó cung cấp cho mỗi phần tử xác suất được chọn khác không.
Phương pháp lấy mẫu ngẫu nhiên đơn giản
Đây là một cách đơn giản để đảm bảo rằng cơ hội thực hiện công việc của nó. Ví dụ: nếu bạn đang chọn một số trẻ trong lớp để tham gia một sự kiện nghệ thuật của trường, tất cả tên của trẻ được đặt trên các lá phiếu gấp giống hệt nhau, trộn trong một chiếc mũ và một số ít được rút ngẫu nhiên.
Tất cả trẻ em trong lớp tạo thành dân số, và một số ít lá phiếu được rút ra khỏi mũ là mẫu.
Sự thành công của thủ tục nằm ở việc lập một danh sách đầy đủ tất cả những đứa trẻ, để không ai bị bỏ sót. Trong một khóa học nhỏ, đây không phải là một vấn đề; Nhưng khi bạn muốn chọn một mẫu từ một tập hợp lớn hơn, bạn phải tinh chỉnh phương pháp.
Có thể tiến hành lấy mẫu ngẫu nhiên đơn giản với thay thế hoặc thay thế. Ví dụ, nếu chúng tôi trích xuất một phần tử từ tổng thể và trả lại sau khi chọn và kiểm tra nó, vũ trụ của các phần tử của chúng tôi luôn giữ nguyên trong suốt quá trình nghiên cứu.
Ngược lại, nếu phần tử đã chọn được nghiên cứu, nhiều hơn không được trả về, thì đó là lấy mẫu mà không cần thay thế. Điều này phải được tính đến khi tính toán xác suất của một phần tử được chọn.
Lấy mẫu ngẫu nhiên có hệ thống
Để thực hiện việc lấy mẫu này, cũng cần liệt kê N phần tử và cũng xác định kích thước của mẫu, chúng ta sẽ gọi là n. Danh sách được gọi là khung lấy mẫu.
Bây giờ khoảng nhảy được xác định, được ký hiệu bằng chữ k và được tính như sau:
Một số ngẫu nhiên được chọn - một cách ngẫu nhiên - từ 1 đến k, được gọi là bắt đầu ngẫu nhiên. Đây là cá nhân đầu tiên trong danh sách được chọn và từ đó các phần tử sau trong danh sách được chọn.
Ví dụ: giả sử bạn có một danh sách 2000 sinh viên từ một trường đại học và bạn muốn lấy một mẫu gồm 100 sinh viên để tham gia vào một đại hội.
Điều đầu tiên cần làm là tìm giá trị của k:
Khi chúng tôi đã chia tổng số học sinh thành 100 phần của 20 học sinh, một trong các phần được lấy và một số ngẫu nhiên được chọn từ 1 đến 20, ví dụ 12. Do đó, học sinh thứ mười hai trong danh sách của chúng tôi là khởi động ngẫu nhiên.
Học sinh tiếp theo được chọn phải là 12 + 20 = 22, rồi 42, rồi 62, v.v., cho đến khi hoàn thành tất cả 100.
Như bạn có thể thấy, đó là một phương pháp áp dụng nhanh chóng và thường cho kết quả rất tốt, không cần phải đặt 2000 cái tên vào mũ và lấy 100 cái tên trong số đó, miễn là không có sự định kỳ trong dân số, điều này làm phát sinh thành kiến .
Lấy mẫu ngẫu nhiên phân tầng
Hình 2. Trong chọn mẫu ngẫu nhiên phân tầng, dân số được chia thành các phân đoạn được gọi là tầng. Nguồn: Pixabay.
Trong lấy mẫu ngẫu nhiên đơn giản, mỗi mục trong tổng thể có xác suất được chọn như nhau. Nhưng điều này có thể không phải lúc nào cũng đúng, đặc biệt là khi có nhiều vấn đề phức tạp hơn để xem xét.
Để thực hiện sơ đồ chọn mẫu ngẫu nhiên phân tầng, dân số phải được chia thành các nhóm có các đặc điểm giống nhau. Đây là các tầng lớp. Các tầng sau đó được lấy và các mẫu ngẫu nhiên đơn giản được chọn từ mỗi mẫu, sau đó được kết hợp để tạo thành mẫu cuối cùng.
Các địa tầng được xác định trước khi lấy mẫu, nghiên cứu các đặc điểm của vũ trụ dữ liệu.
Những đặc điểm này có thể là tình trạng hôn nhân, độ tuổi, nơi bạn sống, ví dụ dân số thành thị, ngoại thành và nông thôn, nghề nghiệp, trình độ học vấn, giới tính và nhiều đặc điểm khác.
Trong mọi trường hợp, người ta mong đợi rằng các đặc điểm của mỗi địa tầng sẽ rất khác biệt, tức là mỗi địa tầng là đồng nhất.
Trong lấy mẫu phân tầng, chúng tôi phân biệt hai loại, tùy theo kích thước mẫu của mỗi tầng có tỷ lệ thuận với kích thước của nó hay không.
Lấy mẫu theo cụm ngẫu nhiên
Các phương pháp được mô tả ở trên chọn trực tiếp các phần tử của mẫu, nhưng trong lấy mẫu theo cụm, một nhóm các phần tử được chọn từ tổng thể và đây sẽ là đơn vị lấy mẫu, được gọi là một cụm.
Ví dụ về các cụm là các phòng ban của một trường đại học, các thực thể địa lý như tỉnh, thành phố, quận hoặc thành phố trực thuộc trung ương, tất cả đều có cùng xác suất được chọn. Trong trường hợp chọn một thực thể địa lý, chúng tôi nói về việc lấy mẫu theo khu vực.
Khi các cụm đã được chọn, các yếu tố cần phân tích sẽ được chọn từ đó. Do đó, thủ tục có thể có nhiều giai đoạn.
Phương pháp này có một số điểm tương đồng với phương pháp ngẫu nhiên phân tầng, ngoại trừ ở đây một số cụm được chọn từ tổng số, trong khi ở phương pháp trước tất cả các tầng của quần thể đều được nghiên cứu.
Các kiểu lấy mẫu phi xác suất
Việc lấy mẫu theo xác suất có thể rất tốn kém trong một số tình huống, vì phải đầu tư thời gian và nguồn lực để tìm ra các mẫu thực sự đại diện.
Cũng thường xảy ra rằng không có một khung lấy mẫu hoàn chỉnh –danh sách-, do đó không thể xác định xác suất chọn một phần tử.
Đối với những trường hợp này, các kiểu lấy mẫu phi xác suất được sử dụng, mà thông tin cũng thu được, mặc dù không đảm bảo độ chính xác của kết quả.
Khi áp dụng kiểu lấy mẫu này, vẫn phải tuân theo một số tiêu chí tại thời điểm lựa chọn, đảm bảo rằng mẫu càng đầy đủ càng tốt.
Lấy mẫu thuận tiện
Đây là một kiểu lấy mẫu khá cơ bản, trong đó các phần tử của mẫu được chọn tùy theo tính sẵn có của chúng, tức là chọn những cá thể phù hợp nhất. Nó có lợi thế là một phương pháp chi phí rất thấp, do sự nhanh chóng và tiện lợi của nó.
Nhưng như đã nói, không có gì chắc chắn để có được thông tin đáng tin cậy về kết quả của bạn. Nó đôi khi được sử dụng để thực hiện các cuộc thăm dò nhanh, ngắn trước một cuộc bầu cử hoặc để hỏi về sở thích của khách hàng đối với một số sản phẩm nhất định.
Ví dụ, một người tham gia bình chọn có thể đi đến lối ra của ba trong số các trung tâm mua sắm gần nhà nhất và hỏi những người rời đi họ sẽ bỏ phiếu cho ứng cử viên nào. Hoặc một giáo viên có thể khảo sát học sinh của chính họ, bởi vì họ có thể tiếp cận chúng ngay lập tức.
Mặc dù có vẻ như kết quả của một thủ tục như vậy là vô giá trị, nhưng nó có thể là một phản ánh tốt về dân số, miễn là có những lý do chính đáng để cho rằng sự sai lệch đó không lớn lắm.
Tuy nhiên, nó không đơn giản như vậy, bởi vì học sinh của một giáo viên nào đó có thể không tạo thành một mẫu đại diện cho phần còn lại của tập thể học sinh. Và hầu hết thời gian, những người thăm dò ý kiến trong các trung tâm mua sắm có xu hướng phỏng vấn những người trông hấp dẫn nhất.
Lấy mẫu hạn ngạch
Để lấy mẫu theo hạn ngạch, cần phải có kiến thức tốt về các tầng lớp dân cư để có thể hình dung được đâu là yếu tố tiêu biểu nhất. Nhưng nó không bị chi phối bởi tiêu chí ngẫu nhiên của lấy mẫu phân tầng.
Trong kiểu lấy mẫu này, cần phải đặt "hạn ngạch", do đó có tên là phương pháp. Các hạn ngạch này bao gồm việc tập hợp một số thành phần với các điều kiện nhất định, ví dụ 15 phụ nữ có độ tuổi từ 25 đến 50, không hút thuốc và cũng sở hữu một chiếc ô tô.
Khi hạn ngạch được xác định, những người đầu tiên đáp ứng các điều kiện đã thiết lập sẽ được chọn. Các tiêu chí cho bước cuối cùng này có thể thuận tiện cho điều tra viên. Ở đây bạn có thể thấy sự khác biệt với phương pháp lấy mẫu phân tầng, là ngẫu nhiên.
Tuy nhiên, đây là một phương pháp chi phí thấp và có lợi nếu, như chúng tôi đã nói, dân số đang được nghiên cứu được biết đến nhiều.
Chọn mẫu bóng tuyết
Quy trình cần tuân theo trong kiểu lấy mẫu này là chọn một vài người dẫn dắt những người khác, và những người này lần lượt đến những người khác, cho đến khi mẫu có kích thước mà nhà nghiên cứu cần.
Đây là một quy trình có thể hữu ích để xác định đặc điểm của một số quần thể với các tính trạng khá cụ thể. Ví dụ: tù nhân trong nhà tù hoặc những người mắc một số bệnh.
Lấy mẫu tùy ý
Cuối cùng ở đây, nhà nghiên cứu là người quyết định các tiêu chí được sử dụng để chọn mẫu của mình, theo hiểu biết của anh ta. Nó có thể hữu ích khi cần thêm một số cá nhân nhất định vào nghiên cứu, những người, sử dụng phương pháp ngẫu nhiên, không thể tham gia.
Người giới thiệu
- Berenson, M. 1985. Thống kê Quản lý và Kinh tế, Các khái niệm và Ứng dụng. Biên tập Interamericana.
- Số liệu thống kê. Lấy mẫu. Được khôi phục từ: encyclopediaeconomica.com.
- Số liệu thống kê. Lấy mẫu. Được khôi phục từ: Estadistica.mat.uson.mx.
- Có thể khám phá. Lấy mẫu theo cụm. Được khôi phục từ: explorerable.com.
- Moore, D. 2005. Thống kê Cơ bản Ứng dụng. lần 2. Phiên bản.
- Netquest. Chọn mẫu theo xác suất: lấy mẫu phân tầng. Được khôi phục từ: netquest.com.
- Wikipedia. Lấy mẫu. Phục hồi từ: es.wikipedia.org