Sự khác biệt giữa T-TEST và ANOVA

KIỂM TRA so với ANOVA

Thu thập và tính toán dữ liệu thống kê để thu được giá trị trung bình thường là một quá trình dài và tẻ nhạt. Thử nghiệm t và phân tích phương sai một chiều (ANOVA) là hai thử nghiệm phổ biến nhất được sử dụng cho mục đích này.

Bài kiểm tra t là bài kiểm tra giả thuyết thống kê trong đó thống kê kiểm tra tuân theo phân phối t của Học sinh nếu giả thuyết không được hỗ trợ. Thử nghiệm này được áp dụng khi thống kê kiểm tra tuân theo phân phối chuẩn và giá trị của một thuật ngữ tỷ lệ trong thống kê kiểm tra được biết đến. Nếu thuật ngữ tỷ lệ không xác định, thì nó sẽ được thay thế bằng ước tính dựa trên dữ liệu có sẵn. Thống kê kiểm tra sẽ tuân theo phân phối t của Học sinh.

William Sealy Gosset đã giới thiệu thống kê t vào năm 1908. Gosset là một nhà hóa học cho nhà máy bia Guinness ở Dublin, Ireland. Nhà máy bia Guinness có chính sách tuyển dụng những sinh viên tốt nghiệp tốt nhất từ ​​Oxford và Cambridge, chọn từ những người có thể cung cấp các ứng dụng hóa sinh và thống kê cho các quy trình công nghiệp được thành lập của công ty. William Sealy Gosset là một trong những người tốt nghiệp như vậy. Trong quá trình này, William Sealy Gosset đã nghĩ ra thử nghiệm t, ban đầu được hình dung là một cách để theo dõi chất lượng của bia đen (loại bia đen mà nhà máy bia sản xuất) theo cách hiệu quả về chi phí. Gosset đã xuất bản bài kiểm tra với bút danh 'Học sinh' ở Biometrika, khoảng năm 1908. Lý do cho tên bút là sự khăng khăng của Guinness, vì công ty muốn giữ chính sách của họ về việc sử dụng số liệu thống kê như một phần của 'bí mật thương mại' của họ.

Thống kê kiểm tra T thường theo mẫu T = Z / s, trong đó Z và s là các hàm của dữ liệu. Biến Z được thiết kế để nhạy cảm với giả thuyết thay thế; một cách hiệu quả, độ lớn của biến Z lớn hơn khi giả thuyết thay thế là đúng. Trong khi đó, 's' là một tham số tỷ lệ, cho phép xác định phân phối của T. Các giả định trong thử nghiệm t là a) Z tuân theo phân phối chuẩn thông thường theo giả thuyết null; b) ps2 tuân theo phân phối Ï 2 với p bậc tự do theo giả thuyết null (trong đó p là hằng số dương); và c) giá trị Z và giá trị s là độc lập. Trong một loại thử nghiệm t cụ thể, những điều kiện này là hậu quả của dân số được nghiên cứu, cũng như cách lấy mẫu dữ liệu.

Mặt khác, phân tích phương sai (ANOVA) là một tập hợp các mô hình thống kê. Mặc dù các nguyên tắc của ANOVA đã được các nhà nghiên cứu và các nhà thống kê sử dụng trong một thời gian dài, nhưng mãi đến năm 1918, Ngài Ronald Fisher mới đưa ra đề nghị chính thức hóa phân tích phương sai trong một bài báo có tựa đề 'Mối tương quan giữa những người có liên quan đến việc thừa kế Mendel' . Kể từ đó, ANOVA đã được mở rộng trong phạm vi và ứng dụng của nó. ANOVA thực sự là một cách gọi sai, vì nó không xuất phát từ sự khác biệt của phương sai mà là từ sự khác biệt giữa các phương tiện của các nhóm. Nó bao gồm các thủ tục liên quan trong đó phương sai quan sát được trong một biến cụ thể được phân vùng thành các thành phần do các nguồn biến thể khác nhau.

Về cơ bản, ANOVA cung cấp một bài kiểm tra thống kê để xác định xem phương tiện của một số nhóm có bằng nhau hay không, và kết quả là, tổng quát hóa kiểm tra t cho nhiều hơn hai nhóm. Một ANOVA có thể hữu ích hơn so với thử nghiệm t hai mẫu vì nó có ít khả năng phạm lỗi loại I. Ví dụ, có nhiều thử nghiệm t hai mẫu sẽ có cơ hội phạm lỗi cao hơn ANOVA của cùng một biến có liên quan để lấy giá trị trung bình. Mô hình là như nhau và thống kê kiểm tra là tỷ lệ F. Nói một cách đơn giản hơn, các bài kiểm tra t chỉ là một trường hợp đặc biệt của ANOVA: thực hiện ANOVA sẽ có cùng kết quả của nhiều bài kiểm tra t. Có ba loại mô hình ANOVA: a) Các mô hình hiệu ứng cố định giả định dữ liệu đến từ các quần thể bình thường, chỉ khác nhau về phương tiện; b) Các mô hình hiệu ứng ngẫu nhiên giả định dữ liệu mô tả một hệ thống phân cấp của các quần thể khác nhau có sự khác biệt bị ràng buộc bởi hệ thống phân cấp; và, c) Các mô hình hiệu ứng hỗn hợp là các tình huống có cả hiệu ứng cố định và ngẫu nhiên.

Tóm lược:

  1.  Kiểm tra t được sử dụng khi xác định hai trung bình hoặc phương tiện là giống nhau hay khác nhau. ANOVA được ưu tiên khi so sánh ba hoặc nhiều trung bình hoặc phương tiện.
  2.  Thử nghiệm t có nhiều khả năng phạm lỗi hơn khi sử dụng nhiều phương tiện hơn, đó là lý do tại sao ANOVA được sử dụng khi so sánh hai hoặc nhiều phương tiện.