- Công thức và phương trình
- Cách tính lỗi lấy mẫu
- Để có một mức độ tự tin
- Ví dụ
- - Ví dụ 1
- Giải pháp
- - Ví dụ 2
- Giải pháp
- - Ví dụ 3
- Giải pháp
- - Ví dụ 4
- Giải pháp
- - Bài tập 5
- Giải pháp
- Người giới thiệu
Các mẫu lỗi hoặc lấy mẫu lỗi trong thống kê là phần chênh lệch giữa giá trị trung bình của một mẫu và giá trị trung bình của dân số. Để minh họa cho ý tưởng này, hãy tưởng tượng rằng tổng dân số của một thành phố là một triệu người, trong đó bạn muốn có cỡ giày trung bình của thành phố để lấy mẫu ngẫu nhiên của một nghìn người.
Kích thước trung bình xuất hiện từ mẫu sẽ không nhất thiết phải trùng với kích thước của tổng thể, mặc dù nếu mẫu không sai lệch thì giá trị phải gần. Sự khác biệt này giữa giá trị trung bình của mẫu và của tổng thể là sai số lấy mẫu.

Hình 1. Vì mẫu là một tập hợp con của tổng dân số, giá trị trung bình của mẫu có một biên độ sai số. Nguồn: F. Zapata.
Nói chung, giá trị trung bình của tổng dân số chưa được biết, nhưng có những kỹ thuật để giảm sai số này và các công thức để ước tính biên sai số lấy mẫu sẽ được thảo luận trong bài viết này.
Công thức và phương trình
Giả sử rằng chúng ta muốn biết giá trị trung bình của một đặc điểm có thể đo lường nhất định x trong một quần thể có kích thước N, nhưng vì N là một số lớn nên không khả thi để thực hiện nghiên cứu trên tổng thể, sau đó chúng ta tiến hành lấy một mẫu ngẫu nhiên kích thước n <
Giá trị trung bình của mẫu được biểu thị bằng
Giả sử m mẫu được lấy từ tổng thể N, tất cả đều có kích thước n bằng nhau với giá trị trung bình
Các giá trị trung bình này sẽ không đồng nhất với nhau và tất cả sẽ xung quanh giá trị trung bình tổng thể μ. Biên sai số lấy mẫu E chỉ ra sự phân tách dự kiến của các giá trị trung bình
Sai số chuẩn ε của mẫu cỡ n là:
ε = σ / √n
trong đó σ là độ lệch chuẩn (căn bậc hai của phương sai), được tính bằng công thức sau:
σ = √
Ý nghĩa của biên sai số chuẩn ε như sau:
Giá trị trung bình
Cách tính lỗi lấy mẫu
Trong phần trước, công thức để tìm biên sai số tiêu chuẩn của mẫu cỡ n đã được đưa ra, trong đó từ tiêu chuẩn chỉ ra rằng đó là biên sai số với độ tin cậy 68%.
Điều này chỉ ra rằng nếu nhiều mẫu có cùng cỡ n được lấy, 68% trong số đó sẽ cho giá trị trung bình
Có một quy tắc đơn giản, được gọi là quy tắc 68-95-99.7 cho phép chúng tôi tìm biên sai số lấy mẫu E cho các mức độ tin cậy 68%, 95% và 99,7% một cách dễ dàng, vì biên này là 1⋅ ε, 2 ⋅ ε và 3⋅ ε tương ứng.
Để có một mức độ tự tin
Nếu mức độ tin cậy γ không phải là một trong các mức trên, thì sai số lấy mẫu là độ lệch chuẩn σ nhân với hệ số Zγ, nhận được bằng quy trình sau:
1. Đầu tiên, mức ý nghĩa α được xác định, mức ý nghĩa này được tính từ mức tin cậy γ thông qua mối quan hệ sau: α = 1 - γ
2.- Sau đó, chúng ta phải tính giá trị 1 - α / 2 = (1 + γ) / 2, tương ứng với tần số chuẩn tích lũy giữa -∞ và Zγ, trong một phân phối chuẩn hoặc Gauss được định hình là F (z), có định nghĩa có thể được nhìn thấy trong hình 2.
3.- Phương trình F (Zγ) = 1 - α / 2 được giải bằng bảng phân phối chuẩn (tích lũy) F, hoặc bằng ứng dụng máy tính có hàm Gaussian nghịch đảo F -1 .
Trong trường hợp sau, chúng ta có:
Zγ = G -1 (1 - α / 2).
4.- Cuối cùng, công thức này được áp dụng cho sai số lấy mẫu với mức độ tin cậy γ:
E = Zγ ⋅ (σ / √n)

Hình 2. Bảng phân phối chuẩn. Nguồn: Wikimedia Commons.
Ví dụ
- Ví dụ 1
Tính toán biên sai số tiêu chuẩn về trọng lượng trung bình của một mẫu gồm 100 trẻ sơ sinh. Việc tính toán trọng lượng trung bình là
Giải pháp
Biên sai số tiêu chuẩn là ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. Điều này có nghĩa là với những dữ liệu này có thể suy ra rằng cân nặng của 68% trẻ sơ sinh là từ 2.950 kg đến 3,25 kg.
- Ví dụ 2
Xác định biên sai số lấy mẫu E và khoảng cân nặng của 100 trẻ sơ sinh với độ tin cậy 95% nếu cân nặng trung bình là 3.100 kg với độ lệch chuẩn σ = 1.500 kg.
Giải pháp
Nếu quy tắc 68 được áp dụng; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, chúng tôi có:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Nói cách khác, 95% trẻ sơ sinh sẽ có cân nặng từ 2.800 kg đến 3.400 kg.
- Ví dụ 3
Xác định phạm vi cân nặng của trẻ sơ sinh trong Ví dụ 1 với độ tin cậy 99,7%.
Giải pháp
Sai số lấy mẫu với độ tin cậy 99,7% là 3 σ / √n, ví dụ của chúng tôi là E = 3 * 0,15 kg = 0,45 kg. Từ đây, kết quả là 99,7% trẻ sơ sinh sẽ có cân nặng từ 2.650 kg đến 3.550 kg.
- Ví dụ 4
Xác định hệ số Z để độ tin cậy 75%. Xác định biên độ sai số lấy mẫu với mức độ tin cậy này cho trường hợp được trình bày trong Ví dụ 1.
Giải pháp
Mức độ tin cậy là γ = 75% = 0,75, liên quan đến mức ý nghĩa α thông qua quan hệ γ = (1 - α), do đó mức ý nghĩa là α = 1 - 0,75 = 0 , 25.
Điều này có nghĩa là xác suất bình thường tích lũy giữa -∞ và Zγ là:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Tương ứng với giá trị Zγ là 1.1503, như trong Hình 3.

Hình 3. Xác định hệ số Zγ ứng với độ tin cậy 75%. Nguồn: F. Zapata thông qua Geogebra.
Nói cách khác, sai số lấy mẫu là E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Khi áp dụng cho dữ liệu từ ví dụ 1, nó sẽ xuất hiện lỗi:
E = 1,15 * 0,15 kg = 0,17 kg
Với độ tin cậy 75%.
- Bài tập 5
Độ tin cậy là bao nhiêu nếu Z α / 2 = 2,4?
Giải pháp
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Mức ý nghĩa là:
α = 0,0164 = 1,64%
Và cuối cùng, mức độ tin cậy vẫn là:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Người giới thiệu
- Canavos, G. 1988. Xác suất và Thống kê: Các ứng dụng và phương pháp. Đồi McGraw.
- Devore, J. 2012. Xác suất và Thống kê cho Kỹ thuật và Khoa học. Thứ 8. Phiên bản. Cengage.
- Levin, R. 1988. Thống kê cho quản trị viên. lần 2. Phiên bản. Sảnh Prentice.
- Sudman, S. 1982. Đặt câu hỏi: Hướng dẫn thực hành để thiết kế bảng câu hỏi. San Francisco. Jossey Bass.
- Walpole, R. 2007. Xác suất và Thống kê cho Kỹ thuật và Khoa học. Lề.
- Wonnacott, TH và RJ Wonnacott. 1990. Thống kê giới thiệu. Ed. Wiley thứ 5
- Wikipedia. Lỗi lấy mẫu. Khôi phục từ: en.wikipedia.com
- Wikipedia. Biên độ sai số. Khôi phục từ: en.wikipedia.com
