- Công thức
- Đặc điểm của phân phối chuẩn
- Khoảng tin cậy
- Các ứng dụng của phân phối chuẩn
- Thí dụ
- Bài tập đã giải quyết
- Người giới thiệu
Các phân phối bình thường hoặc phân phối Gaussian là sự phân bố xác suất trong một biến liên tục, trong đó hàm mật độ xác suất được mô tả bởi một hàm mũ của các đối số bậc hai và tiêu cực, trong đó làm phát sinh một hình chuông.
Tên gọi của phân phối chuẩn xuất phát từ thực tế là phân phối này là phân phối áp dụng cho số lượng lớn nhất các trường hợp trong đó một số biến ngẫu nhiên liên tục có liên quan đến một nhóm hoặc dân số nhất định.

Hình 1. Phân phối chuẩn N (x; μ, σ) và mật độ xác suất của nó f (s; μ,.). (Công phu riêng)
Các ví dụ trong đó phân phối chuẩn được áp dụng là: chiều cao của nam giới hoặc phụ nữ, các biến thể trong số đo của một số độ lớn vật lý hoặc các đặc điểm tâm lý hoặc xã hội học có thể đo lường được như thương số trí tuệ hoặc thói quen tiêu dùng một sản phẩm nhất định.
Mặt khác, nó được gọi là phân bố Gaussian hay chuông Gauss, bởi vì chính thiên tài toán học người Đức này đã được ghi nhận với khám phá của mình về việc sử dụng nó để mô tả sai số thống kê của các phép đo thiên văn vào năm 1800.
Tuy nhiên, người ta nói rằng phân phối thống kê này đã được xuất bản trước đó bởi một nhà toán học vĩ đại người Pháp, chẳng hạn như Abraham de Moivre, vào năm 1733.
Công thức
Hàm phân phối chuẩn trong biến liên tục x, với các tham số μ và σ, được ký hiệu là:
N (x; μ, σ)
và nó được viết rõ ràng như thế này:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
trong đó f (u; μ, σ) là hàm mật độ xác suất:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
Hằng số nhân hàm số mũ trong hàm mật độ xác suất được gọi là hằng số chuẩn hóa và nó đã được chọn theo cách:
N (+ ∞, μ, σ) = 1
Biểu thức trước đó đảm bảo rằng xác suất để biến ngẫu nhiên x nằm giữa -∞ và + ∞ là 1, tức là xác suất 100%.
Tham số μ là trung bình cộng của biến ngẫu nhiên liên tục x và σ độ lệch chuẩn hoặc căn bậc hai của phương sai của cùng một biến đó. Trong trường hợp μ = 0 và σ = 1 thì chúng ta có phân phối chuẩn chuẩn hoặc phân phối chuẩn điển hình:
N (x; μ = 0, σ = 1)
Đặc điểm của phân phối chuẩn
1- Nếu một biến thống kê ngẫu nhiên tuân theo phân phối chuẩn của mật độ xác suất f (s; μ, σ), thì hầu hết dữ liệu được nhóm xung quanh giá trị trung bình μ và nằm rải rác xung quanh nó theo cách ít hơn ⅔ của dữ liệu nằm giữa μ - σ và μ + σ.
2- Độ lệch chuẩn σ luôn luôn dương.
3- Hình dạng của hàm mật độ f tương tự như hình của một cái chuông, đó là lý do tại sao hàm này thường được gọi là chuông Gaussian hoặc hàm Gauss.
4- Trong phân phối Gauss, giá trị trung bình, giá trị trung vị và chế độ trùng nhau.
5- Các điểm uốn của hàm mật độ xác suất chính xác tại μ - σ và μ + σ.
6- Hàm f đối xứng với trục đi qua giá trị trung bình của nó là μ và có tiệm cận đứng bằng không đối với x ⟶ + ∞ và x ⟶ -∞.
7- Giá trị của σ càng cao thì độ phân tán, nhiễu hoặc khoảng cách của dữ liệu xung quanh giá trị trung bình càng lớn. Nói cách khác, σ càng cao thì hình dạng chuông càng mở. Mặt khác, σ nhỏ chỉ ra rằng viên xúc xắc gần với giá trị trung bình và hình dạng của chiếc chuông được đóng hoặc nhọn hơn.
8- Hàm phân phối N (x; μ, σ) cho biết xác suất để biến ngẫu nhiên nhỏ hơn hoặc bằng x. Ví dụ, trong Hình 1 (ở trên) xác suất P mà biến x nhỏ hơn hoặc bằng 1,5 là 84% và tương ứng với khu vực dưới hàm mật độ xác suất f (x; μ, σ) từ -∞ đến x.
Khoảng tin cậy
9- Nếu dữ liệu tuân theo phân phối chuẩn, thì 68,26% trong số này nằm giữa μ - σ và μ + σ.
10- 95,44% dữ liệu tuân theo phân phối chuẩn nằm giữa μ - 2σ và μ + 2σ.
11- 99,74% dữ liệu tuân theo phân phối chuẩn nằm giữa μ - 3σ và μ + 3σ.
12- Nếu một biến ngẫu nhiên x tuân theo phân phối N (x; μ, σ), thì biến
z = (x - μ) / σ tuân theo phân phối chuẩn N (z; 0,1).
Việc thay đổi biến x thành z được gọi là chuẩn hóa hoặc nhập và rất hữu ích khi áp dụng các bảng của phân phối chuẩn cho dữ liệu tuân theo phân phối chuẩn không chuẩn.
Các ứng dụng của phân phối chuẩn
Để áp dụng phân phối chuẩn cần phải thực hiện phép tính tích phân của mật độ xác suất, điều này theo quan điểm phân tích là không dễ dàng và không phải lúc nào cũng có một chương trình máy tính cho phép tính toán số của nó. Vì mục đích này, các bảng giá trị chuẩn hóa hoặc chuẩn hóa được sử dụng, bảng này không khác gì phân phối chuẩn trong trường hợp μ = 0 và σ = 1.

Bảng phân phối chuẩn hóa chuẩn hóa (phần 1/2)

Bảng phân phối chuẩn hóa chuẩn hóa (phần 2/2)
Cần lưu ý rằng các bảng này không bao gồm các giá trị âm. Tuy nhiên, bằng cách sử dụng các tính chất đối xứng của hàm mật độ xác suất Gauss, các giá trị tương ứng có thể nhận được. Bài tập đã giải dưới đây cho biết cách sử dụng bảng trong những trường hợp này.
Thí dụ
Giả sử bạn có một tập hợp dữ liệu ngẫu nhiên x tuân theo phân phối chuẩn của trung bình 10 và độ lệch chuẩn 2. Bạn được yêu cầu tìm xác suất để:
a) Biến ngẫu nhiên x nhỏ hơn hoặc bằng 8.
b) Nhỏ hơn hoặc bằng 10.
c) Biến x nhỏ hơn 12.
d) Xác suất để giá trị x nằm trong khoảng từ 8 đến 12.
Giải pháp:
a) Để trả lời câu hỏi đầu tiên, bạn chỉ cần tính:
N (x; μ, σ)
Với x = 8, μ = 10 và σ = 2. Ta nhận thấy rằng đó là một tích phân không có nghiệm giải tích trong các hàm sơ cấp, mà nghiệm được biểu diễn dưới dạng một nguyên hàm của hàm sai số erf (x).
Mặt khác, có khả năng giải tích phân ở dạng số, đó là điều mà nhiều máy tính, bảng tính và chương trình máy tính như GeoGebra làm được. Hình sau cho thấy giải pháp số tương ứng với trường hợp đầu tiên:

Hình 2. Mật độ xác suất f (x; μ, σ). Vùng bóng mờ đại diện cho P (x ≤ 8). (Công phu riêng)
và câu trả lời là xác suất x dưới 8 là:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) Trong trường hợp này, chúng ta cố gắng tìm xác suất để biến ngẫu nhiên x thấp hơn giá trị trung bình, trong trường hợp này là giá trị 10. Câu trả lời không yêu cầu bất kỳ phép tính nào, vì chúng ta biết rằng một nửa số dữ liệu nằm dưới trung bình và nửa còn lại trên trung bình. Do đó, câu trả lời là:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) Để trả lời câu hỏi này, chúng ta phải tính N (x = 12; μ = 10, σ = 2), có thể được thực hiện bằng máy tính có chức năng thống kê hoặc thông qua phần mềm như GeoGebra:

Hình 3. Mật độ xác suất f (x; μ, σ). Vùng bóng mờ đại diện cho P (x ≤ 12). (Công phu riêng)
Câu trả lời cho phần c có thể được nhìn thấy trong hình 3 và là:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
d) Để tìm xác suất biến ngẫu nhiên x nằm trong khoảng từ 8 đến 12, ta có thể sử dụng kết quả của phần a và c như sau:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Bài tập đã giải quyết
Giá trung bình của cổ phiếu của một công ty là 25 đô la với độ lệch chuẩn là 4 đô la. Xác định xác suất để:
a) Một hành động có chi phí nhỏ hơn $ 20.
b) Cái đó có chi phí lớn hơn $ 30.
c) Giá từ $ 20 đến $ 30.
Sử dụng các bảng phân phối chuẩn để tìm câu trả lời.
Giải pháp:
Để sử dụng các bảng, cần phải chuyển đến biến z chuẩn hóa hoặc được định kiểu:
$ 20 trong biến chuẩn hóa bằng z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 và
$ 30 trong biến chuẩn hóa bằng z = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.
a) 20 đô la bằng -1,25 trong biến chuẩn hóa, nhưng bảng không có giá trị âm, vì vậy chúng tôi xác định vị trí giá trị +1,25 sẽ mang lại giá trị 0,8944.
Nếu bị trừ đi 0,5 khỏi giá trị này, kết quả sẽ là vùng từ 0 đến 1,25, bằng cách này, giống hệt (theo đối xứng) với vùng từ -1,25 đến 0. Kết quả của phép trừ là 0,8944 - 0,5 = 0,3944 là vùng giữa -1,25 và 0.
Nhưng khu vực từ -∞ đến -1,25 được quan tâm, sẽ là 0,5 - 0,3944 = 0,1056. Do đó, người ta kết luận rằng xác suất một cổ phiếu dưới $ 20 là 10,56%.
b) $ 30 trong biến được nhập z là 1,25. Đối với giá trị này, bảng hiển thị số 0,8944, tương ứng với khu vực từ -∞ đến +1,25. Diện tích giữa +1,25 và + ∞ là (1 - 0,8944) = 0,1056. Nói cách khác, xác suất để một cổ phiếu có giá hơn $ 30 là 10,56%.
c) Xác suất để một hành động có chi phí từ $ 20 đến $ 30 sẽ được tính như sau:
100% -10,56% - 10,56% = 78,88%
Người giới thiệu
- Thống kê và xác suất. Phân phối bình thường. Phục hồi từ: projectdescartes.org
- Địa đại số. Đại số địa lý cổ điển, phép tính xác suất. Được khôi phục từ geogebra.org
- MathWorks. Phân phối Gaussian. Được khôi phục từ: es.mathworks.com
- Mendenhall, W. 1981. Thống kê cho Quản lý và Kinh tế. lần thứ 3. phiên bản. Grupo Editorial Iberoamérica.
- Stat Trek. Dạy cho mình Thống kê. Phân phối Poisson. Phục hồi từ: stattrek.com,
- Triola, M. 2012. Thống kê sơ cấp. Ngày 11. Ed. Pearson Education.
- Đại học Vigo. Các phân phối liên tục chính. Đã khôi phục từ: anapg.webs.uvigo.es
- Wikipedia. Phân phối bình thường. Phục hồi từ: es.wikipedia.org
