BẬC TỰ DO: CÁCH TÍNH CHÚNG, LOẠI, VÍ DỤ - DUDAS

Các bậc tự do trong thống kê là số lượng các thành phần độc lập của một vector ngẫu nhiên. Nếu vectơ có n thành phần và có p phương trình tuyến tính liên quan đến các thành phần của nó, thì bậc tự do là np.

Khái niệm bậc tự do cũng xuất hiện trong cơ học lý thuyết, nơi chúng gần tương đương với chiều không gian nơi hạt chuyển động, trừ đi số liên kết.

Hình 1. Một con lắc chuyển động theo hai chiều nhưng nó chỉ có một bậc tự do vì nó bị cưỡng bức chuyển động theo một cung tròn bán kính L. Nguồn: F. Zapata.

Bài viết này sẽ thảo luận về khái niệm bậc tự do áp dụng cho thống kê, nhưng một ví dụ cơ học sẽ dễ hình dung hơn dưới dạng hình học.

Các loại bậc tự do

Tùy thuộc vào ngữ cảnh mà nó được áp dụng, cách tính số bậc tự do có thể khác nhau, nhưng ý tưởng cơ bản luôn giống nhau: tổng số kích thước ít hơn số lượng hạn chế.

Trong một trường hợp cơ học

Ta coi một hạt dao động được buộc vào sợi dây (con lắc) chuyển động trong mặt phẳng xy thẳng đứng (2 chiều). Tuy nhiên, hạt buộc phải chuyển động trên chu vi bán kính bằng chiều dài của hợp âm.

Vì hạt chỉ có thể chuyển động trên đường cong đó nên số bậc tự do là 1. Có thể thấy điều này trong hình 1.

Cách tính số bậc tự do bằng cách lấy hiệu số của số chiều trừ đi số ràng buộc:

bậc tự do: = 2 (kích thước) - 1 (chữ ghép) = 1

Một giải thích khác cho phép chúng tôi đi đến kết quả như sau:

-Chúng ta biết rằng vị trí trong hai chiều được biểu diễn bởi một điểm có tọa độ (x, y).

-Nhưng vì điểm phải tuân theo phương trình của chu vi (x ² + y ² = L ² ) với một giá trị cho trước của biến x nên biến y được xác định bằng phương trình hoặc giới hạn đã nói.

Theo cách này, chỉ một trong các biến là độc lập và hệ thống có một (1) bậc tự do.

Trong một tập hợp các giá trị ngẫu nhiên

Để minh họa ý nghĩa của khái niệm, giả sử vectơ

x = (x ₁ , x ₂ ,…, x _n )

Biểu diễn mẫu của n giá trị ngẫu nhiên có phân phối chuẩn. Trong trường hợp này vectơ ngẫu nhiên x có n thành phần độc lập và do đó x được cho là có n bậc tự do.

Bây giờ chúng ta hãy xây dựng vectơ r của phần dư

r = (x ₁ -, x ₂ -,…., X _n -)

Ở đâu đại diện cho giá trị trung bình của mẫu, được tính như sau:

= (x ₁ + x ₂ +…. + x _n ) / n

Vì vậy, tổng

(x ₁ -) + (x ₂ -) +…. + (X _n -) = (x ₁ + x ₂ +…. + x _n ) - n= 0

Nó là một phương trình biểu diễn một giới hạn (hoặc ràng buộc) trong các phần tử của vectơ r của các phần tử dư, vì nếu biết n-1 thành phần của vectơ r , thì phương trình giới hạn xác định thành phần chưa biết.

Do đó vectơ r có chiều n có giới hạn:

∑ (x _i -) = 0

Nó có (n - 1) bậc tự do.

Một lần nữa người ta áp dụng phép tính số bậc tự do là:

bậc tự do: = n (kích thước) - 1 (ràng buộc) = n-1

Ví dụ

Phương sai và bậc tự do

Phương sai s ² được định nghĩa là trung bình của bình phương độ lệch (hoặc phần dư) của mẫu n dữ liệu:

s ² = ( r • r ) / (n-1)

trong đó r là vectơ của các phần dư r = (x1 -, x2 - ,…., Xn - ) và dấu chấm dày (•) là toán tử sản phẩm dấu chấm. Ngoài ra, công thức phương sai có thể được viết như sau:

s ² = ∑ (x _i -) ² / (n-1)

Trong mọi trường hợp, cần lưu ý rằng khi tính giá trị trung bình của bình phương các phần dư, nó được chia cho (n-1) chứ không phải cho n, vì như đã thảo luận trong phần trước, số bậc tự do của vectơ r là ( n-1).

Nếu để tính phương sai, nó được chia cho n thay vì (n-1), kết quả sẽ có độ chệch rất có ý nghĩa đối với các giá trị của n nhỏ hơn 50.

Trong tài liệu, công thức phương sai cũng xuất hiện với ước số n thay vì (n-1), khi nói đến phương sai của một tập hợp.

Nhưng tập hợp của biến ngẫu nhiên có phần dư, được biểu diễn bằng vectơ r , mặc dù nó có thứ nguyên n, chỉ có (n-1) bậc tự do. Tuy nhiên, nếu số lượng dữ liệu đủ lớn (n> 500), thì cả hai công thức đều hội tụ về cùng một kết quả.

Máy tính và bảng tính cung cấp cả hai phiên bản của phương sai và độ lệch chuẩn (là căn bậc hai của phương sai).

Khuyến nghị của chúng tôi, dựa trên phân tích được trình bày ở đây, là luôn chọn phiên bản có (n-1) mỗi khi phương sai hoặc độ lệch chuẩn cần được tính toán, để tránh kết quả sai lệch.

Trong phân phối Chi bình phương

Một số phân phối xác suất trong biến ngẫu nhiên liên tục phụ thuộc vào một tham số gọi là bậc tự do, đây là trường hợp của phân phối Chi bình phương (χ ² ).

Tên của tham số này chính xác xuất phát từ bậc tự do của vectơ ngẫu nhiên cơ bản mà phân phối này áp dụng.

Giả sử chúng ta có quần thể g, từ đó các mẫu cỡ n được lấy:

X ₁ = (x1 ₁ , x1 ₂ ,… ..x1 _n )

X2 = (x2 ₁ , x2 ₂ ,… ..x2 _n )

….

X _j = (xj ₁ , xj ₂ ,… ..xj _n )

….

Xg = (xg ₁ , xg ₂ ,… ..xg _n )

Một quần thể j có nghĩa là và độ lệch chuẩn Sj, tuân theo phân phối chuẩn N ( , Sj).

Biến zj _i được chuẩn hóa hoặc chuẩn hóa được định nghĩa là:

zj _i = (xj _i - ) / Sj.

Và vectơ Zj được định nghĩa như thế này:

Zj = ( zj ₁ , zj ₂ ,…, zj _i ,…, zj _n ) và tuân theo phân phối chuẩn chuẩn hóa N (0,1).

Vì vậy, biến:

Q = ((z1 ₁ ^ 2 + z2 ₁ ^ 2 +…. + Zg ₁ ^ 2),…., (Z1 _n ^ 2 + z2 _n ^ 2 +…. + Zg _n ^ 2))

tuân theo phân phối χ ² (g) được gọi là phân phối chi bình phương với bậc tự do g.

Trong bài kiểm tra giả thuyết (Với ví dụ đã giải)

Khi bạn muốn kiểm tra các giả thuyết dựa trên một tập hợp dữ liệu ngẫu nhiên nào đó, bạn cần biết số bậc tự do g để áp dụng kiểm định Chi-square.

Hình 2. Có mối quan hệ nào giữa sở thích về HƯƠNG VỊ kem và GIỚI TÍNH của khách hàng không? Nguồn: F. Zapata.

Ví dụ, dữ liệu thu thập được về sở thích ăn kem sô cô la hoặc kem dâu tây của nam giới và phụ nữ trong một tiệm kem nhất định sẽ được phân tích. Tần suất đàn ông và phụ nữ chọn dâu tây hoặc sô cô la được tóm tắt trong Hình 2.

Đầu tiên, bảng tần suất dự kiến được tính toán, được lập bằng cách nhân tổng số hàng với tổng số cột, chia cho tổng dữ liệu. Kết quả được hiển thị trong hình sau:

Hình 3. Tính toán các tần số mong đợi dựa trên các tần số quan sát được (các giá trị màu xanh lam trong hình 2). Nguồn: F. Zapata.

Sau đó, bình phương Chi được tính (từ dữ liệu) bằng công thức sau:

χ ² = ∑ (F _o - F _e ) ² / F _e

Trong đó F _o là tần số quan sát được (Hình 2) và F _e là tần số mong đợi (Hình 3). Tổng kết đi qua tất cả các hàng và cột, trong ví dụ của chúng tôi đưa ra bốn điều khoản.

Sau khi thực hiện các thao tác bạn nhận được:

χ ² = 0,2043.

Bây giờ cần so sánh với bình phương Chi lý thuyết, nó phụ thuộc vào số bậc tự do g.

Trong trường hợp của chúng tôi, con số này được xác định như sau:

g = (# hàng - 1) (# cột - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.

Hóa ra số bậc tự do g trong ví dụ này là 1.

Nếu bạn muốn kiểm tra hoặc bác bỏ giả thuyết rỗng (H0: không có mối tương quan giữa THUẾ và GIỚI) với mức ý nghĩa là 1%, giá trị Chi-bình phương lý thuyết được tính với bậc tự do g = 1.

Giá trị được tìm kiếm làm cho tần suất tích lũy (1 - 0,01) = 0,99, tức là 99%. Giá trị này (có thể lấy từ các bảng) là 6,636.

Khi Chi lý thuyết vượt quá giá trị được tính toán, thì giả thuyết vô hiệu được xác minh.

Nói cách khác, với dữ liệu thu thập được, không có mối quan hệ nào được quan sát thấy giữa các biến TASTE và G GIỚI.

Người giới thiệu

Minitab. Bậc tự do là gì? Được khôi phục từ: support.minitab.com.
Moore, David. (2009) Thống kê ứng dụng cơ bản. Antoni Bosch biên tập viên.
Leigh, Jennifer. Cách tính bậc tự do trong mô hình thống kê. Phục hồi từ: geniolandia.com
Wikipedia. Mức độ tự do (thống kê). Phục hồi từ: es.wikipedia.com
Wikipedia. Mức độ tự do (vật chất). Phục hồi từ: es.wikipedia.com

BẬC TỰ DO: CÁCH TÍNH CHÚNG, LOẠI, VÍ DỤ - DUDAS - 2026