- Bộ so sánh Tukey và bảng
- Thử nghiệm không cân bằng
- Trường hợp ví dụ
- Bài tập đã giải quyết
- Người giới thiệu
Phép thử Tukey là một phương pháp nhằm mục đích so sánh các phương tiện riêng lẻ từ phân tích phương sai của một số mẫu chịu các xử lý khác nhau.
Bài kiểm tra, được trình bày vào năm 1949 bởi John.W. Tukey, cho phép chúng ta phân biệt xem kết quả thu được có khác biệt đáng kể hay không. Nó còn được gọi là bài kiểm tra sự khác biệt có ý nghĩa trung thực của Tukey (bài kiểm tra HSD của Tukey).

Hình 1. Phép thử Tukey cho phép chúng ta phân biệt liệu sự khác biệt về kết quả giữa ba hoặc nhiều phương pháp điều trị khác nhau được áp dụng cho ba hoặc nhiều nhóm có cùng đặc điểm, có giá trị trung bình khác nhau đáng kể và trung thực hay không.
Trong các thí nghiệm khi so sánh ba hoặc nhiều phương pháp xử lý khác nhau cho cùng một số lượng mẫu, cần phải phân biệt liệu các kết quả có khác nhau đáng kể hay không.
Một thí nghiệm được cho là cân bằng khi kích thước của tất cả các mẫu thống kê là như nhau cho mỗi nghiệm thức. Khi kích thước của các mẫu khác nhau đối với mỗi nghiệm thức thì sẽ có một thí nghiệm không cân bằng.
Đôi khi, với phân tích phương sai (ANOVA) là không đủ để biết liệu khi so sánh các phương pháp xử lý (hoặc thí nghiệm) khác nhau được áp dụng cho một số mẫu, chúng có đáp ứng giả thuyết không (Ho: “tất cả các phương pháp điều trị đều bằng nhau”) hay ngược lại, đáp ứng giả thuyết thay thế (Hà: "ít nhất một trong các phương pháp điều trị là khác nhau").
Bài kiểm tra của Tukey không phải là duy nhất, còn nhiều bài kiểm tra nữa để so sánh các phương tiện mẫu, nhưng đây là một trong những cách được biết đến và áp dụng nhiều nhất.
Bộ so sánh Tukey và bảng
Trong ứng dụng của thử nghiệm này, một giá trị w được gọi là bộ so sánh Tukey được tính toán có định nghĩa như sau:
w = q √ (MSE / r)
Trong đó hệ số q thu được từ bảng (Bảng Tukey), bao gồm các hàng giá trị q cho số lần xử lý hoặc thử nghiệm khác nhau. Các cột biểu thị giá trị của hệ số q đối với các bậc tự do khác nhau. Thông thường các bảng có sẵn có ý nghĩa tương đối là 0,05 và 0,01.

Trong công thức này, bên trong căn bậc hai xuất hiện hệ số MSE (Mean Square of Error) chia cho r, cho biết số lần lặp lại. MSE là một số thường thu được từ phân tích các phương sai (ANOVA).

Khi sự khác biệt giữa hai giá trị trung bình vượt quá giá trị w (bộ so sánh Tukey) thì được kết luận rằng chúng là các giá trị trung bình khác nhau, nhưng nếu sự khác biệt nhỏ hơn số Tukey, thì đó là hai mẫu có giá trị trung bình giống nhau về mặt thống kê .
Số w còn được gọi là số HSD (Sự khác biệt đáng kể trung thực).
Số so sánh duy nhất này có thể được áp dụng nếu số lượng mẫu được áp dụng cho thử nghiệm của từng nghiệm thức là như nhau ở mỗi một trong số chúng.
Thử nghiệm không cân bằng
Khi vì một lý do nào đó mà kích thước của các mẫu khác nhau trong mỗi lần xử lý được so sánh, thì quy trình được mô tả ở trên sẽ khác một chút và được gọi là thử nghiệm Tukey-Kramer.
Bây giờ một số so sánh w thu được cho mỗi cặp xử lý i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
Trong công thức này, hệ số q thu được từ bảng Tukey. Hệ số q này phụ thuộc vào số lần xử lý và bậc tự do của sai số. r i là số lần lặp lại trong nghiệm thức i, trong khi r j là số lần lặp lại trong nghiệm thức j.
Trường hợp ví dụ
Một người chăn nuôi thỏ muốn thực hiện một nghiên cứu thống kê đáng tin cậy cho anh ta biết nhãn hiệu nào trong số bốn nhãn hiệu thức ăn vỗ béo thỏ là hiệu quả nhất. Đối với nghiên cứu, ông đã thành lập bốn nhóm với sáu con thỏ một tháng rưỡi tuổi mà cho đến lúc đó có cùng điều kiện cho ăn.

Nguyên nhân là ở nhóm A1 và A4, tử vong xảy ra do nguyên nhân không phải do thức ăn, vì một trong hai con thỏ bị côn trùng cắn và trong trường hợp còn lại, cái chết có thể là do khuyết tật bẩm sinh. Vì vậy, các nhóm không cân bằng và khi đó cần phải áp dụng phép thử Tukey-Kramer.
Bài tập đã giải quyết
Để tránh thực hiện các phép tính quá dài, một trường hợp thí nghiệm cân bằng sẽ được coi như một bài tập đã giải. Những thứ sau sẽ được lấy làm dữ liệu:

Trong trường hợp này, có bốn nhóm tương ứng với bốn phương pháp điều trị khác nhau. Tuy nhiên, chúng tôi quan sát thấy rằng tất cả các nhóm có cùng số lượng dữ liệu, vì vậy nó là một trường hợp cân bằng.
Để thực hiện phân tích ANOVA, công cụ được tích hợp trong bảng tính Libreoffice đã được sử dụng. Các bảng tính khác như Excel có công cụ này được kết hợp để phân tích dữ liệu. Dưới đây là bảng tóm tắt kết quả sau khi phân tích phương sai (ANOVA) đã được thực hiện:

Từ phân tích phương sai, chúng ta cũng có giá trị P, ví dụ là 2,24E-6, thấp hơn nhiều so với mức ý nghĩa 0,05, điều này trực tiếp dẫn đến việc bác bỏ giả thuyết vô hiệu: Tất cả các nghiệm thức đều bằng nhau.
Có nghĩa là, trong số các phương pháp điều trị, một số phương pháp có giá trị trung bình khác nhau, nhưng cần biết điều nào là khác biệt có ý nghĩa thống kê và trung thực (HSD) bằng cách sử dụng thử nghiệm Tukey.
Để tìm số wo, vì số HSD cũng được biết đến, chúng ta cần tìm bình phương trung bình của lỗi MSE. Từ phân tích ANOVA, người ta thu được tổng bình phương trong các nhóm là SS = 0,2; và số bậc tự do trong các nhóm là df = 16 với những dữ liệu này, chúng ta có thể tìm thấy MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Nó cũng được yêu cầu để tìm hệ số q của Tukey, sử dụng bảng. Cột 4, tương ứng với 4 nhóm hoặc phương pháp điều trị được so sánh và hàng 16 được tìm kiếm, vì phân tích ANOVA mang lại 16 bậc tự do trong các nhóm. Điều này dẫn chúng ta đến giá trị của q bằng: q = 4,33 tương ứng với 0,05 mức ý nghĩa hoặc 95% độ tin cậy. Cuối cùng giá trị cho "sự khác biệt đáng kể trung thực" được tìm thấy:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Để biết được các nhóm hoặc phương pháp điều trị khác nhau một cách trung thực, bạn phải biết các giá trị trung bình của mỗi phương pháp điều trị:

Cũng cần biết sự khác biệt giữa các giá trị trung bình của các cặp nghiệm thức, được thể hiện trong bảng sau:

Người ta kết luận rằng các phương pháp điều trị tốt nhất, về mặt tối đa hóa kết quả, là T1 hoặc T3, không quan tâm đến quan điểm thống kê. Để lựa chọn giữa T1 và T3, người ta sẽ phải tìm kiếm các yếu tố khác ngoài phân tích được trình bày ở đây. Ví dụ: giá cả, tình trạng còn hàng, v.v.
Người giới thiệu
- Cochran William và Cox Gertrude. 1974. Các thiết kế thử nghiệm. Đập lúa. Mexico. Tái bản lần thứ ba. 661p.
- Snedecor, GW và Cochran, WG 1980. Phương pháp thống kê. Nhà xuất bản thứ bảy Iowa, Nhà xuất bản Đại học Bang Iowa. 507p.
- Steel, RGD và Torrie, JH 1980. Các nguyên tắc và thủ tục của Thống kê: Phương pháp Tiếp cận Sinh trắc học (Lần xuất bản thứ 2). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. So sánh các phương tiện riêng lẻ trong phân tích phương sai. Sinh trắc học, 5: 99-114.
- Wikipedia. Bài kiểm tra của Tukey. Khôi phục từ: en.wikipedia.com
