Verilerinizin dağıtımının normal olması gerekmez, neredeyse normal olması gereken Örnekleme Dağıtımıdır . Örnek büyüklüğünüz yeterince büyükse, Merkezi Limit Teoremi nedeniyle Landau Dağıtımından ortalama örnekleme dağılımı neredeyse normal olmalıdır .
Bu, verilerinizle birlikte t-testini güvenle kullanabileceğiniz anlamına gelir.
Misal
Bu örneği düşünelim: mu = 0 ve sd = 0.5 ile Lognormal dağılımı olan bir popülasyonumuz olduğunu varsayalım (Landau'ya biraz benziyor)
Bu yüzden her seferinde bu dağılımdan 5000 kez numunenin ortalamasını hesaplayarak 30 gözlem örnekliyoruz
Ve elde ettiğimiz budur
Oldukça normal görünüyor, değil mi? Örnek boyutunu arttırırsak, daha da belirgindir
R kodu
x = seq(0, 4, 0.05)
y = dlnorm(x, mean=0, sd=0.5)
plot(x, y, type='l', bty='n')
n = 30
m = 1000
set.seed(0)
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 30')
x = seq(0.5, 1.5, 0.01)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))
n = 300
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 300')
x = seq(1, 1.25, 0.005)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))