N arttığında daralan değişkenlik, genellikle standart hata olarak ifade edilen örnek ortalamasının değişkenliğidir. Veya, diğer bir deyişle, örnek ortalamanın doğruluğunun kesinliği artmaktadır.
3 erkek ve 3 kadının toplandığı ve boylarını ölçtüğün bir deney yaptığını hayal et. Her grubun ortalama yüksekliğinin, kadın ve erkeklerin ayrı popülasyonlarının gerçek ortalaması olduğuna ne kadar eminsiniz? Hiç emin olamayacağınızı düşünmeliyim. Kolayca 3 yeni numune toplayabilir ve ilkinden birkaç santim yeni araçlar bulabilirsiniz. Bunun gibi tekrarlanan deneylerin birçoğu, kadınların erkeklerden daha uzun olduğunu söylemesine neden olabilir, çünkü araçlar çok değişecektir. Düşük bir N ile, numuneden ortalama olarak pek bir kesinliğe sahip değilsiniz ve numuneler arasında çok değişkenlik gösterir.
Şimdi her grupta 10.000 gözlem düşünün. Birbirinden çok farklı anlamına gelen 10.000 yeni örnek bulmak oldukça zor olacak. Çok daha az değişken olacaklardır ve hassasiyetlerinden daha emin olacaksınız.
Bu düşünce çizgisini kabul ederseniz, istatistiklerinizi hesaplamalarınıza standart hata olarak ekleyebiliriz. Denkleminden de anlaşılacağı gibi, bir parametrenin , (n arttıkça daha doğru olması gerekir), her zaman n, ile artan bir değere bölünür . Bu standart hata, hesaplamalarınızdaki araçların veya etkilerin değişkenliğini gösterir. Ne kadar küçük olursa, istatistiksel testiniz o kadar güçlü olur.σn--√
Burada, standart bir hata ile ilk denemenin birçok kopyasının araçlarının standart sapması arasındaki ilişkiyi göstermek için R'deki küçük bir simülasyon gösterilmektedir. Bu durumda ortalama 100 nüfuslu ve 15 standart sapma ile başlayacağız.
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
Nihai standart sapmanın teorik standart hataya ne kadar yakın olduğuna dikkat edin. Burada n değişkeni ile oynayarak değişkenlik ölçüsünün n arttıkça küçüleceğini görebilirsiniz.
[Bir yana, grafiklerdeki kurtosis gerçekten değişmiyor (normal dağılımlar olduğu varsayılarak). Varyansı düşürmek kurtozu değiştirmez ancak dağılım daha dar görünecektir. Kurtoz değişimlerini görsel olarak incelemenin tek yolu, dağılımları aynı ölçekte koymaktır.]