Eşit olmayan varyanslarla t testinde tamsayı serbestlik derecesi açıklaması


15

SPSS t-Test prosedürü, 2 bağımsız aracı karşılaştırırken 2 analiz, bir varsayı eşit varyanslı ve bir varsayı varyanslı değil olarak karşılaştırır. Eşit varyansların varsayıldığı zaman serbestlik derecesi (df) her zaman tamsayı değerleridir (ve eşit n-2). Eşit varyanslar varsayılmadığında df tamsayı değildir (örn. 11.467) ve hiçbir yerde n-2'ye yakın değildir. Ben bu tamsayı olmayan df hesaplamak için kullanılan mantık ve yöntem bir açıklama arıyorum.


3
Bir University of Florida PowerPoint sunumu , Student t istatistiğinin örnekleme dağılımına bu yaklaşımın eşit olmayan varyanslar için nasıl türetildiğine dair iyi bir açıklama içermektedir .
whuber

Welch'in t-testi her zaman daha doğru mu? Welch yaklaşımını kullanmanın bir dezavantajı var mı?
Joel W.

Welch ve orijinal t-testi önemli ölçüde farklı p'ler verirse, hangisiyle gitmeliyim? Varyanslardaki farklar için p değeri sadece .06 ise, ancak iki t-testinin p değerlerindeki farklar .000 ve .121 ise? (Bu, 2 kişilik bir grubun herhangi bir varyansı olmadığı ve 25'in diğer grubunun 70.000 varyansı olduğu zaman meydana geldi.)
Joel W.

2
Aralarında değeri temelinde seçim yapmayın . Eşit varyans elde etmek için (verileri görmeden önce) iyi bir nedeniniz yoksa, bu varsayımı yapmayın. p
Glen_b

1
Tüm sorular Welch testinin ne zaman kullanılacağı ile ilgilidir. Bu soru stats.stackexchange.com/questions/116610/…
Joel W.

Yanıtlar:


11

Welch-Satterthwaite df'nin, iki serbestlik derecesinin ölçekli ağırlıklı harmonik ortalaması olduğu ve karşılık gelen standart sapmalarla orantılı ağırlıklar gösterdiği gösterilebilir.

Orijinal ifadede şunlar bulunur:

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

Not tahmini varyansını i inci örnek ortalaması veya kare i -inci ortalama standart hatası . Let r = r 1 / r 2 , yani (örnek vasıtasıyla tahmini varyansların oranı)ri=si2/niithir=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

İlk faktör , gelen artışları olan 1 ile r = 0 için 2 de r = 1 ve daha sonra düşer 1 de R = ; log r'de simetriktir .1+sech(log(r))1r=02r=11r=logr

İkinci faktör ağırlıklı bir harmonik ortalamadır :

H(x_)=i=1nwii=1nwixi.

wi=ri2

r1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

Eşit-varyans t-testi ile, varsayımlar geçerliyse, paydanın karesi, bir ki-kare rasgele değişkenin sabit bir katıdır.

Welch t-testinin paydasının karesi (sabit bir zaman) bir ki-kare değildir; bununla birlikte, genellikle bir tahmin çok kötü değildir. İlgili bir tartışma burada bulunabilir .

Daha ders kitabı tarzı türetme bulunabilir burada .


1
Ortalama oranlar için aritmetik ortalamadan daha uygun olan harmonik ortalama hakkında büyük içgörü.
Felipe G. Nievinski

10

ttttts12/n1s22/n2t


Bir t-testi için, SPSS df'yi 26.608 olarak bildirir, ancak iki grup için n'ler 22 ve 104'tür. "Uygun df, daha büyük grubun tam df'si ile df arasında bir yerde olmalıdır" konusunda emin misiniz? (Standart sapmalar sırasıyla, daha küçük ve daha büyük gruplar için 10.5 ve 8.1).
Joel W.

2
s12/n1s22/n2n

(si2/ni)

1
@Glen_b, bunun çok değerli olacağına eminim.
gung - Monica'yı eski
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.