İki grup için t testi ve ANOVA eşitse, neden varsayımları eşdeğer değildir?


47

Kafamın etrafına tamamen sarıldığına eminim, ama çözemiyorum.

T testi, Z dağılımını kullanarak iki normal dağılım karşılaştırır. Bu nedenle DATA'da bir normallik varsayımı var.

ANOVA kukla değişkenli doğrusal regresyona eşdeğerdir ve aynı OLS gibi kareler toplamı kullanır. Bu yüzden RESIDUALS normalliği varsayımı var.

Birkaç yılını aldı, ama sanırım sonunda bu temel gerçekleri kavradım. Öyleyse neden t testi ANOVA'ya iki grupla eşdeğerdir? Veriler hakkında aynı şeyleri kabul etmiyorlarsa nasıl eşdeğer olabilirler?


15
Bir nokta: t testleri Z dağılımını değil t dağılımını kullanır
Jeromy Anglim

1
Soru doğru olmasa da, çok faydalıdır. Ayrıca, bir yerde "iki kuyruklu t testi" demenin soruları / cevapları daha eksiksiz hale getireceğini düşünüyorum.
Gaurav Singhal,

Yanıtlar:


29

İki gruba sahip t testi, her grubun normalde aynı varyansa sahip olduğunu varsaymaktadır (ortalamalar alternatif hipotez altında değişebilir). Bu, regresyon her grubun ortalamasının farklılık göstermesine ancak varyansa izin vermemesine izin verdiği için kukla değişkenli bir regresyona eşdeğerdir. Bu nedenle artıklar (çıkarılmış grupla verilere eşit) aynı dağılıma sahiptir - yani normalde sıfır ortalama ile dağıtılırlar.

Eşit olmayan varyanslı bir t-testi, tek yönlü bir ANOVA ile aynı değildir.


3
Bir alıntıya bakabilirim, ancak deneysel olarak test etmek için bu kadar kolaydır. İki gruba sahip bir ANOVA'dan F, tam olarak t ^ 2'ye eşittir ve p değerleri tam olarak aynı olacaktır. Eşit olmayan varyanslarda eşdeğer olmamasının tek nedeni, bir düzeltme uygulamanızdır. Aksi takdirde, bunlar aynıdır.
Brett,

3
F testi, t testinin genelleştirilmesidir. t testi 2 tedavi karşılaştırması içindir ve F testi çoklu tedaviler içindir. Türetme, Casella'nın İstatistiksel Tasarım, Bölüm 3 ve 4'te yer almaktadır. Ancak, Prof. Hyndman'ın belirttiği gibi, eşit olmayan varyanslarla, artık bir t-testi değildir. Fisher Behren'in sorunu bu. Genellikle Fisher'ın çözümünü kullanmıyoruz, bunun yerine Welch'in Testini veya Bayesian yaklaşımını kullanıyoruz.
suncoolsu

Eşit olmayan varyanslara sahip iki örnekli bir t-testi, iki gruba sahip tek yönlü bir ANOVA'ya eşittir. Belki de demek istediğin, eşit olmayan varyansların düzeltilmesini kullanan bir t-testinin (yani Welch), düzeltilmemiş tek yönlü bir ANOVA ile aynı olmamasıydı (neden olsalardı)?
Brett,

20

T-testi sadece iki grubun karşılaştırıldığı F-testi için özel bir durum. Her ikisinin de sonucu, p değeri açısından tamamen aynı olacaktır ve F ve t istatistikleri arasında da basit bir ilişki vardır. F = t ^ 2. İki test cebirsel olarak eşdeğerdir ve varsayımları aynıdır.

Aslında, bu eşdeğerlikler tüm ANOVA sınıfına, t-testlerine ve doğrusal regresyon modellerine kadar uzanır. T-testi özel bir ANOVA örneğidir. ANOVA özel bir regresyon vakasıdır. Bu prosedürlerin tümü, Genel Doğrusal Model kapsamında değerlendirilir ve aynı varsayımları paylaşır.

  1. Gözlemlerin bağımsızlığı.
  2. Artıkların normalliği = özel durumda her gruptaki normallik.
  3. Artıkların varyanslarının eşitliği = özel durumdaki gruplar arasında eşit farkların olması.

Bunu verilerde normallik olarak düşünebilirsiniz, ancak her grupta normallik kontrolü yapıyorsunuz - bu aslında modeldeki tek öngörücü grubun bir göstergesi olduğunda artıklardaki normallik kontrolü ile aynıdır. Aynı şekilde eşit varyanslarla.

Bir yana, R'nin ANOVA için ayrı rutinleri yok. R'deki anova işlevleri sadece lineer regresyon modellerine uymak için kullanılan aynı şey olan lm () işlevine sarıcıdır - tipik olarak bir regresyon özeti yerine bir ANOVA özeti içinde bulunanı sağlamak için biraz farklı şekilde paketlenmiştir.


Tekrarlanan ölçülerin nasıl uyulacağını bilmek ilginizi çekecektir.
AndyF

1
Kodlama kategorik değişkenleri, regresyon denkliği ve ANOVA modelleri ve tekrarlanan ölçümler için regresyon kodlaması konuları bu makalede anlatılmaktadır. dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/… Alıntılama: Wendorf, CA (2004). Çoklu regresyon kodlaması için astar: Ortak formlar ve ek kontrast durumları. İstatistikleri Anlamak 3, 47-57.
Brett,

4
@AndyF Not lm(), nlmeya da lme4paketi ile karışık modellere geçmediğiniz sürece , ancak Errorterimin uygun şartnamesiyle tekrarlanan ölçümleri yapmanın kullanışlı bir yolu yoktur aov(), Baron & Li öğretici, §6.9, j.mp/ c5ME4u
chl

@AndyF aov(), lm()işlevin üstüne inşa edilmiştir ancak Özel terimler gibi ek argümanlar içerir Error.
chl

aov () basitçe lm () 'ye bir sarıcıdır. Sahnelerin arkasına kodlama yaparak bir miktar kontrast oluşturur ve sonucu ANOVA tarzında paketler. Hepsi lm () ile modellenmiştir. Yukarıda bahsettiğim makalede, regresyon modellerinde lm () de dahil olmak üzere, regresyon modellerinde tekrarlanan kontrastları yapmak için nasıl kodlamanın ayarlanacağını anlatılmaktadır.
Brett

17

Rob'un cevabı ile tamamen aynı fikirdeyim, fakat başka bir yolla söylememe izin ver (wikipedia):

Varsayımlar ANOVA :

  • Durumların bağımsızlığı - bu, istatistiksel analizi basitleştiren modelin bir varsayımıdır.
  • Normallik - artıkların dağılımları normaldir.
  • Eşcinsellik (veya "homojenlik"), eşcinsellik denir

Varsayımlar t-testi :

  • Karşılaştırılan iki popülasyonun her biri normal bir dağılım göstermeli ...
  • ... karşılaştırılmakta olan iki popülasyon aynı varyansa sahip olmalı ...
  • Testi gerçekleştirmek için kullanılan veriler, karşılaştırılan iki popülasyondan bağımsız olarak örneklenmelidir.

Bu nedenle, açıkçası aynı varsayımlara sahip oldukları için soruyu çürütürdüm (farklı bir sırada olmasına rağmen :-)).


Rob'a yapılan yorumları görün.
Alexis

@Alexis Olumsuz oyunuzu anladığımdan emin değilim. Detaylandırmaya özen gösterin.
Henrik

İkinci t testi varsayımı doğru değildir. Öğrencinin orijinal çalışması yoluyla bunu varsaymakla birlikte, "eşit olmayan varyanslar" testin sonraki tedavilerinde yeterince yaygın bir varsayımdır.
Alexis,

5

Herkesin gözardı ettiği açık bir nokta: ANOVA ile açıklayıcı değişkenlerinizin değerlerinden bağımsız olarak ortalamanın aynı olduğunu boşluğa test ediyorsunuz. Bir T-Testi ile, tek taraflı durumu test edebilirsiniz, ortalamanın açıklayıcı değişkeninizin bir değeri diğerine verilmiş olduğundan özellikle daha büyüktür.


1
Yanılmıyorsam, bu bir fark değil. İki gruba ANOVA yaparsanız, o zaman t-testinde olduğu gibi "tek taraflı bir test" yapabilirsiniz. "Tek taraflı test" i tırnak işaretleri arasına koydum çünkü "tek taraflı test" ile "iki taraflı test" arasında "test" den hiçbir fark yok. Tek fark, p değerlerinin istatistiksel önemini nasıl yorumladığınızdır. Yani tek taraflı vs iki taraflı "testler" tamamen aynı "test" dir. Yalnızca sonuçları doğru şekilde yorumlamanın yolu farklıdır.
Tripartio

-3

İki grubu karşılaştırmak için t testi kullanacağım ve nedenlerden dolayı 2'den fazla grup için ANOVA kullanacağım. Önemli sebep, eşit varyans varsayımı olmaktır.


5
Siteye Hoşgeldiniz @ syed. Cevabınızı genişletir misiniz? Örneğin, hangi "nedenleri" kastediyorsunuz? Not bu iki t-testi ve ANOVA eşit varyanslara varsayalım.
gung - Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.