- Công thức và phương trình
- Sự khác biệt với phân phối nhị thức
- Ví dụ
- Ứng dụng thực tế
- Xấp xỉ phân phối nhị thức với phân phối Poisson
- Bài tập đã giải
- Bài tập 1
- Giải pháp c)
- Bài tập 2
- Giải pháp cho)
- Người giới thiệu
Các phân phối Poisson là một phân phối xác suất rời rạc, qua đó người ta có thể biết khả năng mà, trong vòng một cỡ mẫu lớn và trong một khoảng thời gian nhất định, một sự kiện có xác suất là nhỏ sẽ xảy ra.
Phân phối Poisson thường có thể được sử dụng thay cho phân phối nhị thức, miễn là đáp ứng các điều kiện sau: mẫu lớn và xác suất nhỏ.
Hình 1. Đồ thị phân phối Poisson cho các tham số khác nhau. Nguồn: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) đã tạo ra bản phân phối này mang tên ông, rất hữu ích khi đề cập đến các sự kiện không thể đoán trước. Poisson công bố kết quả của mình vào năm 1837, một công trình điều tra về xác suất xảy ra các bản án hình sự có sai sót.
Sau đó, các nhà nghiên cứu khác đã điều chỉnh sự phân bố ở các khu vực khác, chẳng hạn như số lượng các ngôi sao có thể được tìm thấy trong một thể tích không gian nhất định, hoặc xác suất một người lính sẽ chết vì cú đá của ngựa.
Công thức và phương trình
Dạng toán học của phân phối Poisson như sau:
- μ (đôi khi cũng được ký hiệu là λ) là giá trị trung bình hoặc tham số của phân phối
- Số Euler: e = 2.71828
- Xác suất lấy được y = k là P
- k là số lần thành công 0, 1,2,3 …
- n là số lần kiểm tra hoặc sự kiện (cỡ mẫu)
Các biến ngẫu nhiên rời rạc, như tên gọi của chúng, phụ thuộc vào cơ hội và chỉ nhận các giá trị rời rạc: 0, 1, 2, 3, 4…, k.
Giá trị trung bình của phân phối được đưa ra bởi:
Phương sai σ, đo lường mức độ lan truyền của dữ liệu, là một tham số quan trọng khác. Đối với phân phối Poisson đó là:
σ = μ
Poisson xác định rằng khi n → ∞, và p → 0, giá trị trung bình μ - còn được gọi là giá trị kỳ vọng - có xu hướng là một hằng số:
-Các sự kiện hay sự kiện được xét là độc lập với nhau và xảy ra một cách ngẫu nhiên.
-Xác suất P của một sự kiện nào đó xảy ra trong một khoảng thời gian cụ thể là rất nhỏ: P → 0.
-Xác suất của nhiều hơn một sự kiện xảy ra trong khoảng thời gian là 0.
-Giá trị trung bình gần đúng với một hằng số cho bởi: μ = np (n là cỡ mẫu)
-Vì độ phân tán σ bằng μ, khi nó sử dụng các giá trị lớn hơn, độ biến thiên cũng trở nên lớn hơn.
-Events phải được phân bổ đều trong khoảng thời gian sử dụng.
-Tập hợp các giá trị có thể có của biến cố y là: 0,1,2,3,4….
-Tổng của i biến tuân theo phân phối Poisson cũng là một biến Poisson khác. Giá trị trung bình của nó là tổng các giá trị trung bình của các biến này.
Sự khác biệt với phân phối nhị thức
Phân phối Poisson khác với phân phối nhị thức theo những cách quan trọng sau:
-Phân phối nhị thức bị ảnh hưởng bởi cả cỡ mẫu n và xác suất P, nhưng phân phối Poisson chỉ bị ảnh hưởng bởi giá trị trung bình μ.
-Trong phân phối nhị thức, các giá trị có thể có của biến ngẫu nhiên y là 0,1,2,…, N, trong khi trong phân phối Poisson không có giới hạn trên cho các giá trị này.
Ví dụ
Poisson ban đầu áp dụng phân phối nổi tiếng của mình vào các vụ án pháp lý, nhưng ở cấp độ công nghiệp, một trong những cách sử dụng sớm nhất của ông là nấu bia. Trong quá trình này, các mẫu nấm men được sử dụng để lên men.
Nấm men bao gồm các tế bào sống, quần thể của chúng thay đổi theo thời gian. Trong sản xuất bia, cần phải bổ sung một lượng cần thiết, do đó cần phải biết lượng tế bào có trên một đơn vị thể tích.
Trong Chiến tranh thế giới thứ hai, phân phối Poisson được sử dụng để tìm hiểu xem liệu quân Đức có thực sự nhắm vào London từ Calais hay chỉ bắn ngẫu nhiên. Điều này rất quan trọng đối với Đồng minh để xác định mức độ tốt của công nghệ dành cho Đức quốc xã.
Ứng dụng thực tế
Các ứng dụng của phân phối Poisson luôn đề cập đến số đếm trong thời gian hoặc đếm trong không gian. Và vì xác suất xảy ra là nhỏ nên nó còn được gọi là "luật của các sự kiện hiếm".
Dưới đây là danh sách các sự kiện thuộc một trong các danh mục sau:
-Sự ghi nhận của các hạt trong phân rã phóng xạ, giống như sự phát triển của tế bào nấm men, là một hàm số mũ.
-Số lượt truy cập vào một trang web nhất định.
- Tỷ lệ người xếp hàng để trả tiền hoặc được tham dự (lý thuyết xếp hàng).
-Số ô tô đi qua một điểm nhất định trên một con đường, trong một khoảng thời gian nhất định.
Hình 2. Số lượng ô tô đi qua một điểm gần đúng theo phân bố Poisson. Nguồn: Pixabay.
-Các chất bị ảnh hưởng trong một chuỗi DNA nhất định sau khi tiếp xúc với bức xạ.
- Số lượng thiên thạch có đường kính lớn hơn 1 m rơi xuống trong một năm.
- Độ hoàn thiện trên một mét vuông vải.
-Số lượng tế bào máu trong 1 cm khối.
-Các cuộc gọi mỗi phút đến tổng đài điện thoại.
- Chip sô cô la có trong 1 kg bột bánh.
-Số cây bị nhiễm một loại ký sinh trùng nào đó trong 1 ha rừng.
Lưu ý rằng các biến ngẫu nhiên này đại diện cho số lần một sự kiện xảy ra trong một khoảng thời gian cố định (cuộc gọi mỗi phút đến tổng đài điện thoại) hoặc một vùng không gian nhất định (lỗi vải trên mét vuông).
Những sự kiện này, như đã được thiết lập, không phụ thuộc vào thời gian đã trôi qua kể từ lần xuất hiện cuối cùng.
Xấp xỉ phân phối nhị thức với phân phối Poisson
Phân phối Poisson là một xấp xỉ tốt cho phân phối nhị thức miễn là:
-Kích thước của mẫu lớn: n ≥ 100
-Xác suất p nhỏ: p ≤ 0,1
- μ theo thứ tự: np ≤ 10
Trong những trường hợp như vậy, phân phối Poisson là một công cụ tuyệt vời, vì phân phối nhị thức có thể khó áp dụng trong những trường hợp này.
Bài tập đã giải
Bài tập 1
Một nghiên cứu địa chấn học đã xác định rằng trong 100 năm qua, đã có 93 trận động đất lớn trên khắp thế giới, với ít nhất 6,0 độ Richter -logarithmic-. Giả sử rằng phân phối Poisson là một mô hình phù hợp trong trường hợp này. Tìm thấy:
a) Số trận động đất lớn xảy ra trung bình hàng năm.
b) Nếu P (y) là xác suất xảy ra động đất trong một năm được chọn ngẫu nhiên, hãy tìm các xác suất sau:
Nó khá nhỏ hơn P (2).
Kết quả được liệt kê dưới đây:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Ví dụ, chúng ta có thể nói rằng có 39,5% xác suất là không có trận động đất lớn nào xảy ra trong một năm nhất định. Hoặc có 5,29% trong số 3 trận động đất lớn xảy ra trong năm đó.
Giải pháp c)
c) Các tần số được phân tích, nhân với n = 100 năm:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 và 0,00471.
Ví dụ:
- Tần suất 39,5 cho thấy có 0 trận động đất lớn xảy ra trong 39,5 trong số 100 năm, chúng ta có thể nói rằng nó khá gần với kết quả thực tế của 47 năm không có trận động đất lớn nào.
Hãy so sánh một kết quả Poisson khác với kết quả thực tế:
- Giá trị thu được là 36,7 có nghĩa là trong khoảng thời gian 37 năm có 1 trận động đất lớn. Kết quả thực tế là trong 31 năm có 1 trận động đất lớn, phù hợp với mô hình.
- Dự kiến 17,1 năm có 2 trận động đất lớn và được biết trong 13 năm, là một giá trị gần, đã thực sự có 2 trận động đất lớn.
Do đó mô hình Poisson có thể chấp nhận được cho trường hợp này.
Bài tập 2
Một công ty ước tính rằng số lượng linh kiện hỏng trước khi đạt 100 giờ hoạt động theo phân phối Poisson. Nếu số lần hỏng hóc trung bình là 8 lần trong thời gian đó, hãy tìm các xác suất sau:
a) Một thành phần bị lỗi trong 25 giờ.
b) Hỏng dưới hai thành phần, trong thời gian 50 giờ.
c) Ít nhất ba thành phần bị hỏng trong 125 giờ.
Giải pháp cho)
a) Người ta biết rằng trung bình các lần hỏng hóc trong 100 giờ là 8, do đó dự kiến trong 25 giờ sẽ có một phần tư số lần hỏng hóc, tức là 2 lần hỏng hóc. Đây sẽ là tham số μ.
Xác suất 1 thành phần bị lỗi được yêu cầu, biến ngẫu nhiên là "các thành phần bị lỗi trước 25 giờ" và giá trị của nó là y = 1. Bằng cách thay thế trong hàm xác suất:
Tuy nhiên, câu hỏi đặt ra là xác suất để ít hơn hai thành phần bị lỗi trong 50 giờ, chứ không phải chính xác là 2 thành phần hỏng trong 50 giờ, do đó chúng ta phải thêm các xác suất rằng:
-Không thất bại
- Chỉ thất bại 1
Tham số μ của phân bố trong trường hợp này là:
μ = 8 + 2 = 10 lần hỏng trong 125 giờ.
P (3 thành phần trở lên bị lỗi) = 1- P (0) - P (1) - P (2) =
Người giới thiệu
- MathWorks. Phân phối Poisson. Được khôi phục từ: es.mathworks.com
- Mendenhall, W. 1981. Thống kê cho Quản lý và Kinh tế. lần thứ 3. phiên bản. Grupo Editorial Iberoamérica.
- Stat Trek. Dạy cho mình Thống kê. Phân phối Poisson. Phục hồi từ: stattrek.com,
- Triola, M. 2012. Thống kê sơ cấp. Ngày 11. Ed. Pearson Education.
- Wikipedia. Phân phối Poisson. Khôi phục từ: en.wikipedia.org