Artıkların normallik testine dayanmak yerine, normalliği rasyonel yargı ile değerlendirmeyi deneyin. Normallik testleri size verilerinizin normal olduğunu söylemez, sadece olmadığını gösterir. Ancak verilerin bir örnek olduğu göz önüne alındığında, test olmadan aslında normal olmadıklarından emin olabilirsiniz. Gereksinim yaklaşık normaldir. Test bunu söyleyemez. Testler ayrıca büyük N'lerde çok hassas veya daha ciddidir, N ile duyarlılık açısından farklılık gösterir. N'niz, duyarlılığın yükselmeye başladığı aralıktadır. Aşağıdaki simülasyonu R'de birkaç kez çalıştırır ve parsellere bakarsanız, normalite testinin çok sayıda normal dağılımda "normal değil" dediğini göreceksiniz.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Umarım, simülasyonlardan geçtikten sonra bir normalite testinin oldukça normal görünümlü verileri kolayca reddedebildiğini ve normal bir dağılımdan gelen verilerin normalden oldukça uzak görünebileceğini görebilirsiniz. Eğer aşırı bir değer görmek istiyorsanız deneyin n <- 1000
. Dağılımların hepsi normal görünecek, ancak yine de testi daha düşük N değerleriyle aynı oranda başarısız edecektir. Tersine, testi geçen düşük N dağılımları ile normalden çok uzak görünebilir.
SPSS'deki standart kalıntı arsa, normalliği değerlendirmek için çok yararlı değildir. Aykırı değerleri, menzili, uyum iyiliğini ve hatta kaldıraç oranını görebilirsiniz. Ancak normallik ondan türetmek zordur. Histogramları, kantil-kantil normal grafikleri ve artık grafikleri karşılaştırırken aşağıdaki simülasyonu deneyin.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
Son arsadan normalliği veya herhangi bir şeyi anlatmak olağanüstü derecede zordur ve bu nedenle normallik için korkunç bir teşhis koymaz.
Özet olarak, genellikle normallik testlerine değil, artıkların tanısal çizimlerine güvenilmesi önerilir. Bu araziler veya sorunuzdaki gerçek değerler olmadan, verilerinizin analiz veya dönüşüm açısından neye ihtiyacı olduğuna dair sağlam bir tavsiye vermek herkes için çok zordur. En iyi yardımı almak için ham verileri sağlayın.