Perbezaan Antara T-TEST dan ANOVA

T-TEST vs ANOVA

Mengumpul dan mengira data statistik untuk mendapatkan min adalah proses yang panjang dan membosankan. Ujian t dan analisis satu arah varians (ANOVA) adalah dua ujian yang paling biasa digunakan untuk tujuan ini.

Ujian t ialah ujian hipotesis statistik di mana statistik ujian mengikuti sebaran t Pelajar jika hipotesis nol disokong. Ujian ini digunakan apabila statistik ujian mengikuti taburan normal dan nilai istilah skala dalam statistik ujian diketahui. Sekiranya istilah skala tidak diketahui, maka ia akan digantikan dengan anggaran berdasarkan data yang ada. Statistik ujian akan mengikuti pengagihan t-Pelajar.

William Sealy Gosset memperkenalkan t-statistik pada tahun 1908. Gosset adalah seorang ahli kimia untuk pembuatan bir Guinness di Dublin, Ireland. Brewery Guinness mempunyai dasar untuk merekrut graduan terbaik dari Oxford dan Cambridge, memilih dari mereka yang boleh menyediakan aplikasi biokimia dan statistik kepada proses perindustrian syarikat yang mantap. William Sealy Gosset adalah salah seorang graduan itu. Dalam proses itu, William Sealy Gosset menyusun ujian-t, yang awalnya dibayangkan sebagai cara untuk memantau kualiti stout (bir gelap pembuatan bir menghasilkan) dengan cara yang kos efektif. Gosset menerbitkan ujian di bawah nama 'Pelajar' di Biometrika, kira-kira tahun 1908. Alasan nama pen itu adalah desakan Guinness, kerana syarikat itu ingin mengekalkan dasar mereka tentang penggunaan statistik sebagai sebahagian daripada 'rahsia perdagangan'.

Statistik ujian T secara umumnya mengikut bentuk T = Z / s, di mana Z dan s adalah fungsi data. Variabel Z direka untuk menjadi sensitif kepada hipotesis alternatif; Secara berkesan, besarnya pemboleh ubah Z lebih besar apabila hipotesis alternatif adalah benar. Sementara itu, 's' adalah parameter skala, yang membolehkan pengagihan T ditentukan. Anggapan yang mendasari ujian-t ialah: a) Z mengikuti pengagihan biasa standard di bawah hipotesis nol; b) ps2 mengikuti pengedaran Ï ‡ 2 dengan p darjah kebebasan di bawah hipotesis nol (di mana p adalah pemalar positif); dan c) nilai Z dan nilai s adalah bebas. Dalam jenis ujian t tertentu, syarat-syarat ini adalah akibat dari populasi yang dikaji, serta cara di mana data diambil contoh.

Sebaliknya, analisis varians (ANOVA) adalah koleksi model statistik. Walaupun prinsip ANOVA telah digunakan oleh para penyelidik dan ahli statistik untuk masa yang lama, tidak sampai 1918 bahawa Sir Ronald Fisher telah membuat cadangan untuk memformalkan analisis varians dalam artikel bertajuk 'Korelasi Antara Saudara-saudara dengan Anggaran Mendelian Pusaka' . Sejak itu, ANOVA telah berkembang dalam skop dan aplikasinya. ANOVA sebenarnya adalah salah nyata, kerana ia tidak berasal dari perbezaan variasi melainkan dari perbezaan antara cara kumpulan. Ia merangkumi prosedur yang berkaitan di mana varians yang diperhatikan dalam pembolehubah tertentu dibahagikan kepada komponen yang boleh diagihkan kepada sumber yang berlainan.

Pada asasnya, ANOVA menyediakan ujian statistik untuk menentukan sama ada cara beberapa kumpulan semuanya sama dan, sebagai hasilnya, umumkan ujian t kepada lebih daripada dua kumpulan. ANOVA boleh menjadi lebih berguna daripada ujian t-dua kerana ia mempunyai peluang yang lebih kecil untuk melakukan kesilapan jenis I. Sebagai contoh, mempunyai ujian dua t sampel yang banyak akan mempunyai peluang yang lebih besar untuk melakukan kesalahan daripada ANOVA pembolehubah yang sama yang terlibat untuk mendapatkan min. Modelnya adalah sama dan statistik ujian adalah nisbah F. Dalam istilah yang lebih mudah, ujian-t hanyalah kes khas ANOVA: melakukan ANOVA akan mempunyai keputusan yang sama dengan pelbagai ujian t. Terdapat tiga kelas model ANOVA: a) Model kesan-kesan tetap yang menganggap data berasal dari populasi normal, berbeza hanya dengan cara mereka; b) Model kesan rawak yang menganggap data menggambarkan hierarki pelbagai populasi yang perbezaannya dikekang oleh hierarki; dan, c) Model kesan campuran yang merupakan keadaan di mana kedua-dua kesan tetap dan rawak ada.

Ringkasan:

  1.  Ujian t digunakan apabila menentukan sama ada dua purata atau cara adalah sama atau berbeza. ANOVA lebih disukai apabila membandingkan tiga atau lebih purata atau cara.
  2.  Ujian t mempunyai lebih banyak peluang untuk melakukan kesilapan yang lebih banyak digunakan, oleh itu ANOVA digunakan apabila membandingkan dua atau lebih cara.