- Công thức và phương trình
- Các biến thống kê quan trọng
- Mô hình và thuộc tính
- Các tính chất chính của phân bố hypergeometric
- Xấp xỉ bằng cách sử dụng phân phối nhị thức
- Ví dụ 2
- Bài tập đã giải
- Bài tập 1
- Giải pháp
- Bài tập 2
- Giải pháp
- Bài tập 3
- Giải pháp cho
- Giải pháp c
- Người giới thiệu
Các phân phối hypergeometric là một chức năng thống kê rời rạc, thích hợp cho việc tính toán xác suất trong các thí nghiệm ngẫu nhiên với hai kết quả tốt. Điều kiện bắt buộc để áp dụng nó là chúng là những quần thể nhỏ, trong đó những lần rút tiền không bị thay thế và xác suất không đổi.
Do đó, khi một phần tử của tổng thể được chọn để biết kết quả (đúng hoặc sai) của một đặc tính nào đó, thì phần tử đó cũng không thể được chọn lại.
Hình 1. Trong một quần thể bu lông như thế này, chắc chắn có những mẫu vật bị lỗi. Nguồn: Pixabay.
Chắc chắn, phần tử tiếp theo được chọn do đó có nhiều khả năng nhận được kết quả đúng hơn, nếu phần tử trước đó có kết quả âm. Điều này có nghĩa là xác suất thay đổi khi các phần tử được trích xuất từ mẫu.
Các ứng dụng chính của phân phối siêu đại là: kiểm soát chất lượng trong các quy trình có ít dân số và tính toán xác suất trong các trò chơi may rủi.
Đối với hàm toán học xác định phân phối siêu đại, nó bao gồm ba tham số, đó là:
- Số phần tử của quần thể (N)
- Kích thước mẫu (m)
- Số sự kiện trong toàn bộ quần thể có kết quả thuận lợi (hoặc không thuận lợi) của đặc tính nghiên cứu (n).
Công thức và phương trình
Công thức phân phối siêu bội cho xác suất P để xảy ra x trường hợp thuận lợi của một đặc trưng nào đó. Cách viết nó theo toán học, dựa trên các số tổ hợp là:
Trong biểu thức trước N, n và m là các tham số và x là biến chính nó.
- Tổng dân số là N.
-Số kết quả dương tính của một đặc tính nhị phân nào đó đối với tổng thể là n.
-Số lượng các nguyên tố trong mẫu là m.
Trong trường hợp này, X là biến ngẫu nhiên nhận giá trị x và P (x) biểu thị xác suất xuất hiện x trường hợp thuận lợi của đặc trưng được nghiên cứu.
Các biến thống kê quan trọng
Các biến số thống kê khác cho phân phối siêu đại số là:
- Nghĩa là μ = m * n / N
- Phương sai σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Độ lệch chuẩn σ là căn bậc hai của phương sai.
Mô hình và thuộc tính
Để đi đến mô hình phân phối siêu đại, chúng ta bắt đầu từ xác suất thu được x trường hợp thuận lợi trong mẫu có kích thước m. Mẫu này chứa các yếu tố tuân thủ thuộc tính đang nghiên cứu và các yếu tố không tuân thủ.
Nhớ lại rằng n đại diện cho số trường hợp thuận lợi trong tổng thể của N phần tử. Sau đó, xác suất sẽ được tính như thế này:
Biểu diễn điều trên dưới dạng các số tổ hợp, ta đạt được mô hình phân phối xác suất sau:
Các tính chất chính của phân bố hypergeometric
Chúng như sau:
- Mẫu phải luôn nhỏ, ngay cả khi dân số lớn.
- Các phần tử của mẫu được chiết xuất từng phần tử một mà không gộp chúng trở lại tổng thể.
- Thuộc tính cần nghiên cứu là hệ nhị phân, tức là chỉ có thể nhận hai giá trị: 1 hoặc 0, hoặc đúng hoặc sai.
Trong mỗi bước trích xuất phần tử, xác suất thay đổi tùy thuộc vào kết quả trước đó.
Xấp xỉ bằng cách sử dụng phân phối nhị thức
Một tính chất khác của phân phối siêu đại là nó có thể được xấp xỉ bởi phân phối nhị thức, ký hiệu là Bi, miễn là tập hợp N lớn và lớn hơn mẫu m ít nhất 10 lần. Trong trường hợp này, nó sẽ như thế này:
Xác suất để x = 3 vít trong mẫu bị lỗi là: P (500, 5, 60, 3) = 0,0129.
Về phần mình, xác suất để x = 4 vít trong số sáu mươi của mẫu bị lỗi là: P (500, 5, 60; 4) = 0,0008.
Cuối cùng, xác suất để x = 5 vít trong mẫu đó bị lỗi là: P (500, 5, 60; 5) = 0.
Nhưng nếu bạn muốn biết xác suất trong mẫu đó có nhiều hơn 3 vít bị lỗi, thì bạn phải lấy xác suất tích lũy, thêm:
Ví dụ này được minh họa trong hình 2, thu được bằng cách sử dụng GeoGebra, một phần mềm miễn phí được sử dụng rộng rãi trong các trường học, viện và trường đại học.
Hình 2. Ví dụ về phân phối siêu phương. Được soạn thảo bởi F. Zapata với GeoGebra.
Ví dụ 2
Một bộ bài Tây Ban Nha có 40 lá, trong đó 10 lá có vàng và 30 lá còn lại thì không. Giả sử rằng 7 lá bài được rút ngẫu nhiên từ bộ bài đó, chúng không được hợp nhất lại vào bộ bài.
Nếu X là số vàng có trong 7 quân bài được rút ra, thì xác suất để có x vàng trong một lần rút 7 quân bài được cho bởi phân phối siêu bội P (40,10,7; x).
Hãy xem như thế này: để tính xác suất có 4 vàng trong một lần rút 7 quân bài, chúng ta sử dụng công thức phân phối siêu bội với các giá trị sau:
Và kết quả là: xác suất 4,57%.
Nhưng nếu bạn muốn biết xác suất nhận được nhiều hơn 4 thẻ, thì bạn phải thêm:
Bài tập đã giải
Tập hợp các bài tập dưới đây nhằm minh họa và đồng hóa các khái niệm đã được trình bày trong bài viết này. Điều quan trọng là người đọc cố gắng giải quyết chúng một mình, trước khi xem xét giải pháp.
Bài tập 1
Một nhà máy sản xuất bao cao su đã phát hiện ra rằng cứ 1000 chiếc bao cao su được sản xuất bởi một máy nào đó thì có 5 chiếc bị lỗi. Để kiểm tra chất lượng, 100 bao cao su được lấy ngẫu nhiên và lô bị loại nếu có ít nhất một hoặc nhiều lỗi. Câu trả lời:
a) Khả năng con số 100 bị loại bỏ là bao nhiêu?
b) Tiêu chí kiểm soát chất lượng này có hiệu quả không?
Giải pháp
Trong trường hợp này, các số tổ hợp rất lớn sẽ xuất hiện. Việc tính toán rất khó, trừ khi bạn có một gói phần mềm phù hợp.
Nhưng vì nó là một tập hợp lớn và mẫu nhỏ hơn mười lần so với tổng dân số, nên có thể sử dụng tính gần đúng của phân phối siêu bội theo phân phối nhị thức:
Trong biểu thức trên, C (100, x) là một số tổ hợp. Sau đó xác suất có nhiều hơn một bị lỗi sẽ được tính như sau:
Đó là một giá trị gần đúng tuyệt vời, nếu so sánh với giá trị thu được bằng cách áp dụng phân phối siêu bội: 0,4102
Có thể nói, với xác suất 40%, một lô 100 thuốc dự phòng nên bị loại bỏ, hiệu quả không cao.
Tuy nhiên, yêu cầu ít hơn một chút trong quá trình kiểm tra chất lượng và chỉ loại bỏ lô 100 nếu có từ hai lỗi trở lên, thì xác suất loại bỏ lô sẽ giảm xuống chỉ còn 8%.
Bài tập 2
Một máy tạo khối nhựa hoạt động theo cách mà cứ 10 chiếc thì có một chiếc bị biến dạng. Trong một mẫu có 5 mảnh, khả năng chỉ có một mảnh bị lỗi là bao nhiêu?
Giải pháp
Dân số: N = 10
Số n lỗi cho mọi N: n = 1
Kích thước mẫu: m = 5
Do đó xác suất 50% là trong mẫu có 5 khối, một khối sẽ bị biến dạng.
Bài tập 3
Trong một buổi họp mặt của những người trẻ tốt nghiệp trung học có 7 quý bà và 6 quý ông. Trong số các cô gái, 4 người học nhân văn và 3 người khoa học. Trong nhóm nam, 1 học nhân văn và 5 khoa học. Tính toán sau:
a) Chọn ngẫu nhiên ba cô gái: khả năng họ đều học ngành nhân văn là bao nhiêu?
b) Nếu ba người tham dự buổi họp mặt bạn bè được chọn ngẫu nhiên: Khả năng ba người trong số họ, không phân biệt giới tính, nghiên cứu khoa học cả ba, hoặc nhân văn cũng có cả ba?
c) Bây giờ chọn ngẫu nhiên hai bạn và gọi x là biến ngẫu nhiên "số bạn học nhân văn". Giữa hai giá trị được chọn, hãy xác định giá trị trung bình hoặc giá trị kỳ vọng của x và phương sai σ ^ 2.
Giải pháp cho
Các giá trị để sử dụng bây giờ là:
-Pulation: N = 14
-Số lượng nghiên cứu các chữ cái là: n = 6 và
-Kích thước của mẫu: m = 3.
-Số bạn học khoa nhân văn: x
Theo điều này, x = 3 có nghĩa là cả ba đều nghiên cứu về nhân văn, nhưng x = 0 có nghĩa là không có học về nhân văn. Xác suất để cả ba nghiên cứu giống nhau được cho bởi tổng:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Sau đó, chúng tôi có xác suất 21% rằng ba người tham dự cuộc họp, được chọn ngẫu nhiên, sẽ nghiên cứu cùng một điều.
Giải pháp c
Ở đây chúng tôi có các giá trị sau:
N = 14 tổng số bạn bè, n = 6 tổng số trong dân số nghiên cứu khoa học nhân văn, cỡ mẫu là m = 2.
Hy vọng là:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
Và phương sai:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (14/6) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Người giới thiệu
- Các phân phối xác suất rời rạc. Đã khôi phục từ: biplot.usal.es
- Thống kê và xác suất. Phân phối siêu phương. Phục hồi từ: projectdescartes.org
- CDPYE-UGR. Phân phối siêu phương. Phục hồi từ: ugr.es
- Địa đại số. Đại số địa lý cổ điển, phép tính xác suất. Được khôi phục từ geogebra.org
- Hãy thử dễ dàng. Đã giải quyết các vấn đề về phân phối hypergeometric. Phục hồi từ: probafacil.com
- Minitab. Phân phối siêu phương. Được khôi phục từ: support.minitab.com
- Đại học Vigo. Các bản phân phối rời rạc chính. Đã khôi phục từ: anapg.webs.uvigo.es
- Vitutor. Thống kê và tổ hợp. Phục hồi từ: vitutor.net
- Weisstein, Eric W. Hypergeometric Distribution. Được khôi phục từ: mathworld.wolfram.com
- Wikipedia. Phân phối siêu phương. Phục hồi từ: es.wikipedia.com