- Dữ liệu được nhóm lại
- Thí dụ
- 3 biện pháp chính của xu hướng trung tâm
- 1- Trung bình số học
- 2- Trung bình
- 3- Thời trang
- Người giới thiệu
Các thước đo về xu hướng trung tâm của dữ liệu nhóm được sử dụng trong thống kê để mô tả các hành vi nhất định của một nhóm dữ liệu được cung cấp, chẳng hạn như giá trị của chúng gần với giá trị nào, giá trị trung bình của dữ liệu được thu thập là bao nhiêu, trong số những hành vi khác.
Khi lấy một lượng lớn dữ liệu, rất hữu ích khi nhóm chúng lại để có thứ tự tốt hơn và do đó có thể tính toán các thước đo nhất định về xu hướng trung tâm.
Trong số các thước đo xu hướng trung tâm được sử dụng rộng rãi nhất là trung bình cộng, trung vị và phương thức. Những con số này nói lên những phẩm chất nhất định về dữ liệu được thu thập trong một thử nghiệm nhất định.
Để sử dụng các biện pháp này, trước tiên bạn cần biết cách nhóm một tập dữ liệu.
Dữ liệu được nhóm lại
Để nhóm dữ liệu, trước tiên bạn phải tính toán phạm vi của dữ liệu, phạm vi này thu được bằng cách lấy giá trị cao nhất trừ đi giá trị thấp nhất của dữ liệu.
Sau đó, một số "k" được chọn, là số lớp mà chúng ta muốn nhóm dữ liệu.
Phạm vi được chia cho "k" để có được biên độ của các lớp được nhóm lại. Con số này là C = R / k.
Cuối cùng, việc phân nhóm bắt đầu, trong đó một số nhỏ hơn giá trị thấp nhất của dữ liệu thu được sẽ được chọn.
Con số này sẽ là giới hạn dưới của lớp đầu tiên. Để điều này được thêm C. Giá trị thu được sẽ là giới hạn trên của lớp đầu tiên.
Sau đó, C được thêm vào giá trị này và nhận được giới hạn trên của lớp thứ hai. Bằng cách này, chúng tôi tiến hành lấy giới hạn trên của lớp cuối cùng.
Sau khi dữ liệu được nhóm lại, giá trị trung bình, giá trị trung bình và chế độ có thể được tính toán.
Để minh họa cách tính trung bình cộng, trung vị và chế độ, chúng ta sẽ tiến hành với một ví dụ.
Thí dụ
Do đó, khi nhóm dữ liệu, một bảng như sau sẽ thu được:
3 biện pháp chính của xu hướng trung tâm
Bây giờ chúng ta sẽ tiến hành tính toán trung bình cộng, trung vị và thức. Ví dụ trên sẽ được sử dụng để minh họa quy trình này.
1- Trung bình số học
Trung bình số học bao gồm nhân mỗi tần số với giá trị trung bình của khoảng thời gian. Sau đó, tất cả các kết quả này được thêm vào, và cuối cùng nó được chia cho tổng dữ liệu.
Sử dụng ví dụ trước, sẽ nhận được rằng trung bình cộng bằng:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Điều này chỉ ra rằng giá trị trung bình của dữ liệu trong bảng là 5.11111.
2- Trung bình
Để tính giá trị trung bình của một tập dữ liệu, trước tiên chúng ta sắp xếp thứ tự tất cả dữ liệu từ nhỏ nhất đến lớn nhất. Hai trường hợp có thể xảy ra:
- Nếu số dữ liệu là số lẻ thì số trung vị là số liệu nằm ngay chính giữa.
- Nếu số dữ liệu là số chẵn thì trung vị là giá trị trung bình của hai dữ liệu nằm ở trung tâm.
Khi nói đến dữ liệu được nhóm, việc tính giá trị trung bình được thực hiện như sau:
- N / 2 được tính toán, trong đó N là tổng dữ liệu.
- Khoảng đầu tiên mà tần số tích lũy (tổng các tần số) lớn hơn N / 2 được tìm kiếm và giới hạn dưới của khoảng này được chọn, được gọi là Li.
Trung vị được cho bởi công thức sau:
Tôi = Li + (Ls-Li) * (N / 2 - Tần số tích lũy trước Li) / tần số của [Li, Ls)
Ls là giới hạn trên của khoảng nói trên.
Nếu bảng dữ liệu trước đó được sử dụng, N / 2 = 18/2 = 9. Các tần số tích lũy là 4, 8, 14 và 18 (một cho mỗi hàng của bảng).
Do đó, khoảng thứ ba phải được chọn, vì tần số tích lũy lớn hơn N / 2 = 9.
Vậy Li = 5 và Ls = 7. Áp dụng công thức được mô tả ở trên, bạn phải:
Tôi = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3- Thời trang
Chế độ là giá trị có tần suất cao nhất trong số tất cả các dữ liệu được nhóm; nghĩa là, nó là giá trị được lặp lại nhiều lần nhất trong tập dữ liệu ban đầu.
Khi bạn có một lượng rất lớn dữ liệu, công thức sau được sử dụng để tính toán chế độ của dữ liệu được nhóm:
Mo = Li + (Ls-Li) * (tần số Li - Tần số L (i-1)) / ((tần số Li - Tần số L (i-1)) + (tần số Li - Tần số L ( i + 1)))
Khoảng [Li, Ls) là khoảng mà tần số cao nhất được tìm thấy. Đối với ví dụ được thực hiện trong bài viết này, chế độ được cung cấp bởi:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Một công thức khác được sử dụng để lấy giá trị gần đúng cho chế độ là như sau:
Mo = Li + (Ls-Li) * (tần số L (i + 1)) / (tần số L (i-1) + tần số L (i + 1)).
Với công thức này, các tài khoản như sau:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Người giới thiệu
- Bellhouse, DR (2011). Abraham De Moivre: Tạo tiền đề cho xác suất cổ điển và các ứng dụng của nó. CRC Nhấn.
- Cifuentes, JF (2002). Giới thiệu về Lý thuyết Xác suất. Đại học Quốc gia Colombia.
- Daston, L. (1995). Xác suất Cổ điển trong Thời kỳ Khai sáng. Nhà xuất bản Đại học Princeton.
- Larson, HJ (1978). Giới thiệu về lý thuyết xác suất và suy luận thống kê. Biên tập Limusa.
- Martel, PJ & Vegas, FJ (1996). Xác suất và thống kê toán học: ứng dụng trong thực hành lâm sàng và quản lý sức khỏe. Các ấn bản của Díaz de Santos.
- Vázquez, AL, & Ortiz, FJ (2005). Phương pháp thống kê để đo lường, mô tả và kiểm soát sự biến thiên. Ed. Đại học Cantabria.
- Vázquez, SG (2009). Sách hướng dẫn Toán học vào Đại học. Biên tập Centro de Estudios Ramon Areces SA.