Sezgisel bir açıklama yapmaya çalışacağım.
T istatistiği * bir pay ve paydaya sahiptir. Örneğin, bir örnek t-testindeki istatistik
x¯−μ0s/n−−√
* (birkaç tane var, ancak bu tartışma umarım sorduğunuzları kapsayacak kadar genel olmalıdır)
Varsayımlar altında, pay ortalama 0 ve bazı bilinmeyen standart sapmalarla normal bir dağılıma sahiptir.
Aynı varsayımlar altında payda, payın dağılımının standart sapmasının bir tahminidir (paydaki istatistiğin standart hatası). Paydan bağımsızdır. Karesi, serbestlik derecelerine (t-dağılımının df'sidir ) çarpı bir ki-kare rasgele değişkendir .σnumerator
Serbestlik dereceleri küçük olduğunda, payda oldukça dik eğridir. Ortalamasından daha düşük olma şansı ve oldukça küçük olma şansı yüksektir. Aynı zamanda, ortalamasından çok, çok daha büyük olma şansına da sahiptir.
Normallik varsayımı altında pay ve payda bağımsızdır. Dolayısıyla, bu t-istatistiğin dağılımından rasgele çizersek, normal bir rasgele sayıya, ortalama olarak yaklaşık 1 olan sağ eğrili bir dağılımdan ikinci rasgele * seçilen değere bölünür.
* normal terime bakılmaksızın
Paydada olduğu için paydanın dağılımındaki küçük değerler çok büyük t-değerleri üretir. Paydadaki sağ eğim, t istatistiklerini ağır kuyruklu hale getirir. Payda daha keskin aynı standart sapma ile normalden daha zirve t-dağılımını yapan dağılımı, sağ arka t .
Bununla birlikte, serbestlik dereceleri arttıkça, dağılım ortalamasının etrafında çok daha normal görünümlü ve çok daha "sıkı" hale gelir.
Bu nedenle, payda tarafından bölünmenin payın dağılım şekli üzerindeki etkisi, serbestlik derecesi arttıkça azalır.
Sonunda - Slutsky'nin teoreminin bize olabileceği gibi - paydanın etkisi daha çok bir sabitle bölünmeye benzer ve t istatistiklerinin dağılımı normale çok yakındır.
Payda karşılıklı olarak kabul edilir
whuber, yorumlarda paydanın karşılığına bakmanın daha aydınlatıcı olabileceğini öne sürdü. Yani, t-istatistiklerimizi pay (karşılıklı) payda karşılıklı (normal eğim) olarak yazabiliriz.
Örneğin, yukarıdaki tek örnekli-t istatistiğimiz:
n−−√(x¯−μ0)⋅1/s
Şimdi orijinal nüfusu standart sapması dikkate , σ x . Onunla çarpabilir ve bölebiliriz:Xiσx
n−−√(x¯−μ0)/σx⋅σx/s
İlk terim standart normaldir. İkinci terim (ölçeklendirilmiş ters-ki-kare rasgele değişkenin kare kökü) daha sonra bu standardı "normal olarak" ya da daha büyük olan değerlerle ölçeklendirir.
Normallik varsayımı altında, üründeki iki terim bağımsızdır. Dolayısıyla, bu t-istatistiğin dağılımından rasgele çizersek, sağ çarpıklık dağılımından normal bir rasgele sayı (üründeki ilk terim) çarpı ikinci bir rastgele seçilen değerin (normal terime bakılmaksızın) tipik olarak 'yaklaşık 1.
Df büyük olduğunda, değer 1'e çok yakın olma eğilimindedir, ancak df küçük olduğunda, oldukça eğridir ve yayılma büyüktür, bu ölçeklendirme faktörünün büyük sağ kuyruğu kuyruğu oldukça şişman hale getirir: