T-testinin normalite varsayımı hakkında soru


9

T-testleri için, çoğu metne göre popülasyon verilerinin normal olarak dağıtıldığı varsayımı vardır. Bunun neden olduğunu anlamıyorum. Bir t-testi, sadece numune araçlarının örnekleme dağılımının popülasyonun değil normal olarak dağıtılmasını gerektirmez mi?

Eğer t-testinin sonuçta örnekleme dağılımında normallik gerektirmesi durumunda, nüfus herhangi bir dağılıma benzeyebilir, değil mi? Makul bir örnek boyutu olduğu sürece. Merkezi limit teoreminin belirttiği bu değil mi?

(Burada tek örnek veya bağımsız örnek t-testlerine atıfta bulunuyorum)


1
Rastgele değişken olarak örnek ortalaması ancak tekli kısımlar da normal olduğunda normal olabilir. Ama haklısın: t testi asemptotik olarak parametrik değildir (normal dağılım yok), ancak yine de grup içi varyanslar (iki örnekli durumda) benzer ve mevcut olmalıdır.
Michael M

Grup içi varyansların benzer olması nedeniyle, varyansın homojenliği varsayımından mı bahsediyorsunuz? Eğer öyleyse, levhanın t-testi bunun için doğru, değil mi?
Peter Nash

Evet kesinlikle. Eğer Welch'in düzeltilmiş serbestlik derecesi sonsuza kadar giderse, prosedürü de dağıtımdan arınmış olacaktır (ancak atıf gerekir ...).
Michael M

Yanıtlar:


9

T-testleri için, çoğu metne göre popülasyon verilerinin normal olarak dağıtıldığı varsayımı vardır. Bunun neden olduğunu anlamıyorum. Bir t-testi, sadece numune araçlarının örnekleme dağılımının popülasyonun değil normal olarak dağıtılmasını gerektirmez mi?

T-istatistiği, her iki rasgele değişken olmak üzere iki miktardan oluşur. Sadece bir paydan ibaret değildir.

T istatistiğinin t dağılımına sahip olması için, sadece örnek ortalamanın normal bir dağılıma sahip olması gerekmez. Ayrıca şunlara ihtiyacınız vardır:

  • bu s paydada öyle olsun ki s2/σ2χd2*

  • pay ve payda bağımsız olmalıdır.

*(değeri d tek numunede hangi teste bağlı t sahibiz d=n1)

Bu üç şeyin gerçekten doğru olması için, orijinal verilerin normal olarak dağıtılması gerekir.

Eğer t-testinin sonuçta örnekleme dağılımında normallik gerektirmesi durumunda, nüfus herhangi bir dağılıma benzeyebilir, değil mi?

Bir anlığına verilen şekilde alalım. CLT'nin nüfusu elinde tutması için koşullara uyması gerekir ... - nüfusun CLT'nin uygulandığı bir dağılımı olması gerekir. Dolayısıyla hayır, çünkü CLT'nin uygulanmadığı nüfus dağılımları vardır.

Makul bir örnek boyutu olduğu sürece. Merkezi limit teoreminin belirttiği bu değil mi?

Hayır, CLT aslında "makul örnek büyüklüğü" hakkında tek bir kelime söylemiyor.

Aslında herhangi bir sonlu örnek büyüklüğünde neler olduğu hakkında hiçbir şey söylemez.

Şu anda belirli bir dağılımı düşünüyorum. CLT'nin kesinlikle uyguladığı bir şey. Ama şu andan=1015, örnek ortalamanın dağılımı açıkça normal değildir. Yine de, insanlık tarihindeki herhangi bir örneğin içinde bu kadar çok değer bulunduğundan şüpheliyim. Peki - totolojinin dışında - makul olan nedirn' anlamına gelmek?


Yani ikiz problemleriniz var:

C. İnsanların genellikle CLT'ye atfettikleri etki - küçük / orta ölçekli örnek boyutlarındaki örnekleme araçlarının dağılımının normalliklerine giderek daha yakın bir yaklaşım - aslında CLT ** 'de belirtilmemiştir.

B. "Payda normalden çok uzak olmayan bir şey" istatistiğin t-dağılımına sahip olması için yeterli değildir

** (Berry-Esseen teoremi gibi bir şey, insanların artan örneklem büyüklüğünün örnek araçların dağılımı üzerindeki etkisine baktıklarında, insanların gördüklerine daha çok benzemektedir.)


CLT ve Slutsky'nin teoremi birlikte (tüm varsayımları geçerli olduğu sürece) n, t-istatistik yaklaşımların dağılımı standart normaldir. Herhangi bir sonlu olup olmadığın bir amaç için yeterli olabilir.


1
Bu üç şeyin [örnek ortalamasının normalliği, örnek varyansının ki-kareliği ve ikisinin bağımsızlığı] gerçekten doğru olması için, orijinal verilerin normal olarak dağıtılması gerekir. Sadece Normal'in bu üç özelliğe sahip olduğunu mu söylüyorsunuz? İfadenin yanlış olduğunu iddia etmiyorum, sadece söylediğiniz şey olup olmadığını merak ediyorum.
Andrew M

2
@AndrewM Kesinlikle sadece normalin üçü birlikte var. Ek olarak, sadece birinci veya üçüncü normal olanı ima etmek için yeterlidir - üçüncüsü normali karakterize eder ( Lukacs, 1942 ) ve sınırlı sayıda bağımsız rastgele değişken için, sadece normal ilk olana sahiptir ( Cramér'in ayrışma teoremi ). İkinciyi almanın başka bir yolu olduğu düşünülebilir, ama bir tanesinin farkında değilim.
Glen_b

@AndrewM, ikincisi ile ilgili olarak, Ahsanullah'ın (1987,1989) çalışması önemli olabilir.
Glen_b

1
Bu referanslar için teşekkürler @Glen_b! Lukacs sonucunun farkında değildim ve Cramer'in ayrışma teoremi belirtildiği gibi başımın üst kısmındaki versiyondan daha güçlü (X Normal iff AX Normal, tüm matrisler için A).
Andrew M

@AndrewM Buradaki fark, Cramer'in sonucuna göre, bağımsızlığa bağlı olmadığından bahsettiğiniz sonuçtur. İkisi de yerinde faydalı.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.