Yorumların anlamlı olması için bu paragraftan ayrılıyorum: Muhtemelen orijinal popülasyonlardaki normallik varsayımı çok kısıtlayıcıdır ve örnekleme dağılımına odaklanarak ve özellikle büyük numuneler için merkezi sınır teoremi sayesinde vazgeçilebilir.
t
Bahsettiğiniz gibi, bu hızlı R grafiğinin gösterdiği gibi, örnek arttıkça t-dağılımı normal dağılıma yaklaşmaktadır:
t
Bu nedenle, z-testinin uygulanması büyük örneklerle tamamlanabilir.
İlk cevabımla ilgili sorunları çözme. Teşekkürler, OP için yardımınız için Glen_b (yorumdaki muhtemel yeni hatalar tamamen benimdir).
- T İSTATİSTİK, NORMALite VARSASINDA DAĞILIMDA TAKİP EDİYOR:
Tek örnekli - iki örnekli (eşleştirilmiş ve eşleştirilmemiş) formüllerin karmaşıklıklarını bir kenara bırakarak, bir örnek ortalamasını bir popülasyon ortalamasıyla karşılaştırmaya odaklanan genel t istatistiği :
t-test=X¯−μsn√=X¯−μσ/n√s2σ2−−−√=X¯−μσ/n−−√∑nx=1(X−X¯)2n−1σ2−−−−−−−−√(1)
Xμσ2
- (1) ∼N(1,0)
- (1)s2/σ2n−1∼1n−1χ2n−1(n−1)s2/σ2∼χ2n−1
- Pay ve payda bağımsız olmalıdır.
t-statistic∼t(df=n−1)
- MERKEZİ LİMİT TEOREMİ:
Numune boyutu arttıkça, numune araçlarının örnekleme dağılımının normallik eğilimi, popülasyon normal olmasa bile payın normal dağılımını varsayabilir. Bununla birlikte, diğer iki durumu etkilemez (paydanın ki kare dağılımı ve paydanın paydadan bağımsızlığı).
Ancak hepsi kaybolmaz, bu yazıda , Payda'nın chi dağılımı karşılanmamış olsa bile Slutzky teoreminin normal dağılıma doğru asimptotik yakınsamayı nasıl desteklediği tartışılmaktadır.
- DAYANIKLILIK:
Psikolojik Bültende Sawilowsky SS ve Blair RC tarafından "Testin Nüfus Normallerinden Kalkışlara Dayanıklılık ve Tip II Hata Özelliklerine Daha Gerçekçi Bir Bakış" , 1992, Cilt. 111, No. 2, 352-360 , burada güç ve tip I hataları için daha az ideal veya daha fazla "gerçek dünya" (daha az normal) dağılımını test ettiler, aşağıdaki iddialar bulunabilir: "Tip ile ilgili muhafazakar yapıya rağmen Bu gerçek dağılımlardan bazıları için t testinde hata yaptım, çalışılan çeşitli tedavi koşulları ve örnek boyutları için güç seviyeleri üzerinde çok az etkisi oldu. Araştırmacılar, biraz daha büyük bir örnek boyutu seçerek güçteki küçük kaybı kolayca telafi edebilir " .
" Hakim görüş, Tip-1 hataları söz konusu olduğunda, Gauss olmayan popülasyon şekline (a) örnek büyüklükleri eşit veya neredeyse aynı olduğu sürece, (b) örnek için, bağımsız örnekler t testinin makul derecede sağlam olduğu görülmektedir. boyutları oldukça büyüktür (Boneau, 1960, 25 ila 30 örnek boyutlarından bahseder) ve (c) testler tek kuyruklu olmaktan ziyade iki kuyrukludur.Bu koşulların karşılanması ve nominal alfa ile gerçek alfa arasındaki farkların ortaya çıkarsa, tutarsızlıklar genellikle liberal nitelikten ziyade muhafazakar bir durumdur. "
Yazarlar konunun tartışmalı yönlerini vurguluyor ve Profesör Harrell'in belirttiği gibi lognormal dağılıma dayalı bazı simülasyonlar üzerinde çalışmayı dört gözle bekliyorum. Parametrik olmayan yöntemlerle bazı Monte Carlo karşılaştırmaları da yapmak istiyorum (örneğin Mann-Whitney U testi). Yani bu devam eden bir çalışma ...
SIMULATIONS:
Feragatname: Bu alıştırmalardan biri "bunu kendim kanıtlamak" için şu ya da bu şekilde. Sonuçlar genelleme yapmak için kullanılamaz (en azından benim tarafımdan değil), ama sanırım bu iki (muhtemelen kusurlu) MC simülasyonunun, şartlarda t testinin kullanımı konusunda cesaret kırıcı görünmediğini söyleyebilirim tanımladı.
Tip I hatası:
n=50μ=0σ=1
5%4.5%
Aslında elde edilen t testlerinin yoğunluğunun grafiği, t-dağılımının gerçek pdf'siyle örtüşüyor gibi görünüyordu:
En ilginç kısım t testinin "paydası" na, ki-kare dağılımını izlemesi gereken kısma bakıyordu:
(n−1)s2/σ2=98(49(SD2A+SD2A))/98(eσ2−1)e2μ+σ2
Burada, bu Wikipedia girişinde olduğu gibi ortak standart sapmayı kullanıyoruz :
SX1X2=(n1−1)S2X1+(n2−1)S2X2n1+n2−2−−−−−−−−−−−−−−−−−−−−−−√
Ve şaşırtıcı bir şekilde (veya değil), arsa üst üste bindirilmiş ki-kare pdf'den oldukça farklıydı:
Tip II Hata ve Güç:
109
5%0.024%99%
Kod burada .