İki yöntemi karşılaştırmak için t testi yerine ANOVA kullanmak yanlış mıdır?


11

Maaş dağılımım var ve erkekler ve kadınlar için ortalamalar arasındaki farkı karşılaştırmak istiyorum. İki yöntemi karşılaştırmak için öğrenci T testi olduğunu biliyorum ama ANOVA'yı önerdikten sonra ANOVA'nın ikiden fazla yolu karşılaştırmak için olduğunu söyleyen bazı eleştiriler aldım.

, (Varsa) 'dir yanlış sadece 2 vasıtanın karşılaştırılması için kullanarak?


9
Kim yanlış olduğunu söylüyor?
gung - Monica'yı eski

1
Neden herhangi bir varsayımı baskılayan soruyu yeniden ifade etmiyorsunuz? "İki grup karşılaştırılırken ANOVA bir t-testine eşdeğer mi?" Sadece bir fikir ... Sorunun her iki şekilde de ne kadar hoş olduğu konusunda hiçbir sorumluluk kabul etmem :-)
Antoni Parellada

4
Alternatif olarak sorunuzu, birine yanlış olduğunu söyleyecek şekilde değiştirin ... böylece yanıldıklarını açıklayabiliriz. Buradaki zorluk, sorunun yanlış olduğu yönündeki yanlıştır.
Glen_b-Monica'yı yeniden kur

1
Öncül yanlış olsa da, bu soru konu dışı gibi görünmüyor ya da cevaplanamayacağı çok açık değil (gerçekten de cevaplandı). Bence bu açık kalabilir.
gung - Monica'yı

1
Kabul etti, @ gung. Sorunun konu hakkında bilgi eksikliğini yansıttığını düşünüyorum. Eğer farklı (veya "daha iyi") şeklinde ifade edilmiş olsaydı, o zaman soru muhtemelen sorulmayacaktı, çünkü o zaman cevabı zaten bileceklerdi.
D_Williams

Yanıtlar:


20

Bu yanlış değildir ve eşit varyanslar alan testte eşdeğer olacaktır. Dahası, iki grupla, sqrt (f-istatistiği) t-istatistiğinin (aboslute değerine) eşittir. Eşit olmayan varyanslara sahip bir t-testinin eşdeğer olmadığından biraz eminim. Varyanslar eşit olmadığında uygun tahminler alabildiğiniz için (varyanslar genellikle bir ondalık basamağa eşit değildir), ANOVA'dan daha esnek olduğu için muhtemelen t-testinin kullanılması mantıklıdır (yalnızca iki grubunuz olduğu varsayılarak).

Güncelleme:

Eşit varyans t testi için eşit olmayan t testi için t-istatistiği ^ 2'nin f-istatistiği ile aynı olduğunu gösteren kod.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1, eşit olmayan varyanslar için tek yönlü bir ANOVA / F testinin ayarlanabileceğini unutmayın (bkz . Heteroskedastik veriler için tek yönlü ANOVA'ya alternatifler ).
gung - Monica'yı eski

@gung OK. Bu konuda emin değildim, çünkü bir ara ANOVA kullanmadım (Bayesli bir şey yapıyordum).
D_Williams

tt

4

Eşdeğerler. Sadece iki gruplu bir ANOVA, bir t-testine eşdeğerdir. Fark, birkaç grubunuz olduğunda, hipotezi birlikte test edemediğiniz için, t-testleri için tip I hatası artacaktır. Bir F testi ile birlikte test ettiğiniz için ANOVA bu problemden muzdarip değildir.


1
Gücünü kaybettiğini sanmıyorum, sanırım I tipi hatalarla daha fazla ilgisi var. Genel olarak, ne kadar çok teste sahip olursanız, o kadar yüksek güce sahip olmalısınız.
HelloWorld

İnanıyorum (@StudentT'ın dediği gibi) bu tip I hataları meselesidir, Bir kursta bize tam olarak bunun için "Bonferroni Düzeltmesi" ni kullanmamızı sağlıyoruz. en.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez

Evet, haklısın. Güç (tip II) değil, tip I hataları olmalıdır. Akıl yürütmenin doğru olduğuna inanıyorum ama bir sebepten dolayı tip 1 hatası değil güç yazdım. Kimseyi kandırmayacağımdan emin olmak için düzenleyeceğim.
robinsa
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.