- Cân nhắc quan trọng
- Lấy mẫu phân tầng là gì?
- Quy trình thực hiện lấy mẫu phân tầng
- Các loại
- Lấy mẫu phân tầng theo tỷ lệ
- Lấy mẫu phân tầng thống nhất
- Ưu điểm và nhược điểm
- - Lợi thế
- Thu thập các tính năng chính
- Độ chính xác thống kê cao hơn
- Cỡ mẫu nhỏ hơn
- - Nhược điểm
- Khó khăn khi tìm địa tầng
- Sự phức tạp để tổ chức
- Thí dụ
- Tạo ra các tầng
- Người giới thiệu
Các mẫu phân tầng , hoặc phân tầng, là một phương pháp lấy mẫu liên quan đến việc phân chia dân số thành các phân nhóm nhỏ hơn, gọi là tầng lớp nhân dân. Đổi lại, các tầng lớp này được hình thành dựa trên các thuộc tính hoặc đặc điểm chung của các thành viên, chẳng hạn như thu nhập hoặc trình độ học vấn.
Nó được sử dụng để làm nổi bật sự khác biệt giữa các nhóm trong một quần thể, trái ngược với việc lấy mẫu đơn giản, coi tất cả các thành viên của một quần thể là bình đẳng, với cùng một xác suất được lấy mẫu.
Nguồn: needpix.com
Mục đích là cải thiện độ chính xác của mẫu bằng cách giảm sai số lấy mẫu. Nó có thể tạo ra giá trị trung bình có trọng số với ít biến thiên hơn giá trị trung bình số học của một mẫu dân số đơn giản.
Phân tầng là quá trình phân mảnh các thành viên của một quần thể thành các tập con đồng nhất trước khi lấy mẫu. Thông qua các tầng lớp, một sự phân bố dân cư được xác định.
Có nghĩa là, nó phải được tổng thể toàn diện và loại trừ lẫn nhau, do đó, một tầng duy nhất phải được chỉ định cho mỗi phần tử của quần thể. Sau đó, một hệ thống hoặc lấy mẫu đơn giản được áp dụng trong mỗi tầng.
Cân nhắc quan trọng
Điều quan trọng cần lưu ý là các lớp không được xếp liền nhau. Việc có các nhóm con chồng chéo lên nhau sẽ giúp một số người có cơ hội được chọn làm đối tượng cao hơn. Điều này hoàn toàn làm lu mờ khái niệm lấy mẫu phân tầng như một nguyên mẫu lấy mẫu.
Điều quan trọng không kém là nhà nghiên cứu phải sử dụng cách chọn mẫu đơn giản trong các tầng khác nhau.
Các tầng lớp phổ biến nhất được sử dụng trong lấy mẫu phân tầng là tuổi, giới tính, tình trạng kinh tế xã hội, tôn giáo, quốc tịch và trình độ học vấn.
Lấy mẫu phân tầng là gì?
Khi hoàn thành phân tích về một nhóm các đối tượng có đặc điểm tương tự, điều tra viên có thể nhận thấy rằng quy mô dân số quá lớn để hoàn thành điều tra.
Để tiết kiệm thời gian và tiền bạc, có thể đưa ra quan điểm khả thi hơn bằng cách chọn một nhóm nhỏ từ dân số. Nhóm nhỏ này được gọi là cỡ mẫu, là một tập hợp con của dân số được sử dụng để đại diện cho toàn bộ dân số.
Một mẫu từ tổng thể có thể được chọn theo nhiều cách, một trong số đó là lấy mẫu phân tầng. Điều này liên quan đến việc chia tổng dân số thành các nhóm đồng nhất được gọi là tầng lớp. Sau đó, các mẫu ngẫu nhiên được chọn từ mỗi tầng.
Quy trình thực hiện lấy mẫu phân tầng
- Chia dân số thành các nhóm con hoặc các tầng nhỏ hơn, theo các thuộc tính và đặc điểm mà các thành viên chia sẻ.
- Lấy ngẫu nhiên một mẫu từ mỗi tầng với số lượng tỷ lệ với kích thước của tầng đó.
- Nhóm các tập hợp con của địa tầng để tạo thành một mẫu ngẫu nhiên.
- Tiến hành phân tích.
Ví dụ: hãy xem xét một nhà nghiên cứu muốn biết số lượng sinh viên kinh doanh nhận được lời mời làm việc trong vòng ba tháng sau khi tốt nghiệp vào năm 2018. Họ sẽ sớm phát hiện ra rằng đã có gần 200.000 sinh viên kinh doanh tốt nghiệp năm đó.
Bạn có thể quyết định chỉ cần lấy một mẫu ngẫu nhiên gồm 5.000 sinh viên tốt nghiệp và tiến hành cuộc khảo sát. Tốt hơn, bạn có thể chia dân số thành các tầng và lấy một mẫu ngẫu nhiên từ các tầng đó.
Để làm điều này, bạn sẽ tạo các nhóm dân số dựa trên độ tuổi, chủng tộc, quốc tịch hoặc nền tảng nghề nghiệp.
Một mẫu ngẫu nhiên sẽ được lấy từ mỗi tầng, tương ứng với kích thước của tầng đối với tổng dân số. Các tập hợp con này sẽ được nhóm lại với nhau để tạo thành một mẫu.
Các loại
Lấy mẫu phân tầng theo tỷ lệ
Trong kiểu này, kích thước mẫu cho mỗi tầng tỷ lệ với quy mô dân số của tầng khi so sánh với tổng dân số. Điều này có nghĩa là mỗi tầng có cùng tốc độ lấy mẫu.
Khi một đặc điểm của các cá thể được chọn để xác định địa tầng, các phân nhóm kết quả thường có kích thước khác nhau.
Ví dụ, chúng tôi muốn nghiên cứu tỷ lệ phần trăm dân số Mexico hút thuốc, và quyết định rằng tuổi tác sẽ là một tiêu chí tốt để phân tầng vì người ta tin rằng thói quen hút thuốc có thể thay đổi đáng kể theo độ tuổi. Ba tầng được xác định:
- Dưới 20 tuổi.
- Từ 20 đến 44.
- Hơn 44.
Khi dân số của Mexico được chia thành ba tầng lớp này, ba nhóm này sẽ không có cùng quy mô. Trên thực tế, dữ liệu thực tế xác nhận điều này:
- Tầng 1: 42,4 triệu (41,0%).
- Tầng 2: 37,6 triệu (36,3%).
- Tầng 3: 23,5 triệu (22,7%).
Nếu sử dụng phương pháp lấy mẫu phân tầng theo tỷ lệ, thì mẫu phải bao gồm các tầng duy trì cùng tỷ lệ với quần thể. Nếu bạn muốn tạo một mẫu gồm 1.000 cá thể, các mẫu phải có kích thước sau:
Nó rất giống với việc tập hợp một dân số nhỏ hơn, được xác định bởi tỷ lệ tương đối của các tầng lớp trong dân số.
Lấy mẫu phân tầng thống nhất
Trong kiểu này, cùng một cỡ mẫu được chỉ định cho tất cả các tầng xác định, bất kể trọng lượng của các tầng này trong quần thể.
Lấy mẫu phân tầng thống nhất lấy ví dụ trước sẽ tạo ra mẫu sau cho mỗi tầng:
Phương pháp này ủng hộ các tầng lớp có tỷ trọng dân số ít hơn, bằng cách cấp cho họ mức độ quan trọng tương đương với các tầng lớp phù hợp hơn.
Điều này làm giảm hiệu quả tổng thể của mẫu, nhưng cho phép nghiên cứu các đặc điểm riêng của từng tầng với độ chính xác cao hơn.
Trong ví dụ, nếu bạn muốn đưa ra tuyên bố cụ thể về dân số của tầng 3 (trên 44), bạn có thể giảm lỗi lấy mẫu bằng cách sử dụng mẫu 333 đơn vị, thay vì mẫu 227 đơn vị, như thu được từ lấy mẫu phân tầng theo tỷ lệ.
Ưu điểm và nhược điểm
Lấy mẫu phân tầng hoạt động tốt đối với các quần thể có nhiều thuộc tính khác nhau, nhưng sẽ không hiệu quả nếu không thể hình thành các nhóm con.
- Lợi thế
Thu thập các tính năng chính
Ưu điểm chính của lấy mẫu phân tầng là nó thu thập các đặc điểm chính của quần thể trong mẫu.
Tương tự như trung bình có gia quyền, phương pháp lấy mẫu này tạo ra các đặc điểm trong mẫu tỷ lệ với tổng dân số.
Độ chính xác thống kê cao hơn
Việc phân tầng cho phép ước lượng ít sai số hơn so với phương pháp lấy mẫu đơn giản. Sự khác biệt giữa các tầng càng lớn thì độ chính xác càng lớn.
Có độ chính xác thống kê cao hơn khi so sánh với lấy mẫu đơn giản. Điều này là do thực tế là trong các phân nhóm, độ biến thiên thấp hơn khi so sánh với các biến thể xảy ra với tổng dân số.
Cỡ mẫu nhỏ hơn
Vì kỹ thuật này có độ chính xác thống kê cao, điều đó cũng có nghĩa là nó yêu cầu cỡ mẫu nhỏ hơn, điều này có thể giúp các nhà nghiên cứu tiết kiệm rất nhiều công sức, tiền bạc và thời gian.
- Nhược điểm
Thật không may, phương pháp nghiên cứu này không thể được sử dụng trong tất cả các nghiên cứu. Nhược điểm của phương pháp là phải đáp ứng một số điều kiện để nó được sử dụng một cách chính xác.
Khó khăn khi tìm địa tầng
Nhược điểm chính là có thể khó xác định các tầng thích hợp cho một nghiên cứu. Ngoài ra, việc tìm kiếm một danh sách đầy đủ và chính xác về toàn bộ dân số có thể là một thách thức.
Sự phức tạp để tổ chức
Một nhược điểm thứ hai là việc tổ chức và phân tích kết quả phức tạp hơn so với việc lấy mẫu đơn giản.
Các nhà nghiên cứu phải xác định từng thành viên của quần thể nghiên cứu và chỉ phân loại thành một quần thể con. Kết quả là, lấy mẫu phân tầng là bất lợi khi các nhà nghiên cứu không thể tự tin phân loại từng thành viên của dân số vào một nhóm con.
Juxtaposition có thể là một vấn đề nếu có các đối tượng nằm trong nhiều nhóm con. Khi lấy mẫu đơn giản được thực hiện, những người trong nhiều nhóm con có nhiều khả năng được chọn hơn. Kết quả có thể là sự trình bày sai hoặc phản ánh không chính xác về dân số.
Ví dụ như sinh viên đại học, sinh viên tốt nghiệp, nam giới và phụ nữ, làm cho nó dễ dàng, vì họ là các nhóm được xác định rõ ràng.
Tuy nhiên, trong các tình huống khác, nó có thể khó khăn hơn nhiều. Bạn có thể tưởng tượng việc kết hợp các đặc điểm như chủng tộc, dân tộc hoặc tôn giáo. Quá trình phân loại sẽ trở nên khó khăn hơn, làm cho việc lấy mẫu phân tầng trở thành một phương pháp không hiệu quả.
Thí dụ
Giả sử một nhóm nghiên cứu muốn xác định điểm trung bình của sinh viên đại học ở Hoa Kỳ.
Nhóm nghiên cứu gặp khó khăn rõ ràng trong việc thu thập dữ liệu này từ 21 triệu sinh viên đại học. Do đó, bạn quyết định lấy một mẫu từ dân số, chỉ sử dụng 4.000 sinh viên.
Nhóm nghiên cứu xem xét các thuộc tính khác nhau của những người tham gia mẫu và tự hỏi liệu có sự khác biệt giữa điểm trung bình và chuyên môn của học sinh hay không.
Người ta thấy trong mẫu có 560 sinh viên là sinh viên tiếng Anh, 1.135 sinh viên khoa học, 800 sinh viên khoa học máy tính, 1.090 sinh viên kỹ thuật và 415 sinh viên toán học.
Nhóm nghiên cứu muốn sử dụng lấy mẫu phân tầng tỷ lệ, trong đó các tầng mẫu tỷ lệ với mẫu dân số.
Tạo ra các tầng
Để làm được điều này, nhóm nghiên cứu điều tra số liệu thống kê của sinh viên đại học ở Mỹ và tìm ra tỷ lệ chính thức của sinh viên chuyên: tiếng Anh 12%, khoa học 28%, khoa học máy tính 24%, kỹ thuật 21% và 15%. Trong toán học.
Do đó, năm địa tầng được tạo ra từ quá trình lấy mẫu phân tầng. Nhóm nghiên cứu phải xác nhận rằng tầng dân số tỷ lệ với tầng mẫu. Tuy nhiên, ông thấy rằng tỷ lệ không bằng nhau.
Do đó, nhóm nghiên cứu cần lấy mẫu lại dân số 4.000 sinh viên, nhưng lần này chọn ngẫu nhiên 480 (12%) người học tiếng Anh, 1.120 (28%) khoa học, 960 (24%) khoa học máy tính, 840 ( 21%) trong kỹ thuật và 600 (15%) trong toán học.
Với điều này, chúng tôi có một mẫu sinh viên đại học được phân tầng theo tỷ lệ, cung cấp đại diện tốt hơn về sinh viên đại học ở Hoa Kỳ.
Các nhà nghiên cứu sẽ có thể làm nổi bật một tầng cụ thể, quan sát các nghiên cứu khác nhau của sinh viên đại học Hoa Kỳ và quan sát các điểm trung bình khác nhau.
Người giới thiệu
- Adam Hayes (2019). Lấy mẫu ngẫu nhiên phân tầng. Lấy từ: investmentopedia.com.
- Wikipedia, bách khoa toàn thư miễn phí (2019). Lấy mẫu phân tầng. Lấy từ: en.wikipedia.org.
- Có thể khám phá (2019). Phương pháp lấy mẫu phân tầng. Lấy từ: explorerable.com.
- Khảo sát Gizmo (2019). Lấy mẫu phân tầng là gì và khi nào thì sử dụng? Lấy từ: Surveygizmo.com.
- Ashley Crossman (2019). Tìm hiểu về các mẫu phân tầng và cách tạo ra chúng. Thought Co. Lấy từ: thinkco.com.
- Carlos Ochoa (2017). Random sampling: lấy mẫu phân tầng. Lấy từ: netquest.com.