Shapiro-Wilk’in güçlü bir normallik testi olduğuna dikkat edin.
En iyi yaklaşım, kullanmak istediğiniz herhangi bir prosedürün ne kadar hassas olduğu konusunda çeşitli normalliklerin çeşitliliği olduğu hakkında bir fikir sahibi olmaktır. kabul edilebilir).
Grafiklere bakmak için gayri resmi bir yaklaşım, sahip olduğunuzla aynı örnek büyüklüğünde normal olan bir dizi veri seti üretmek olacaktır - (örneğin, 24 tane). Gerçek verilerinizi bu tür arsaların ızgaralarına yerleştirin (24 rastgele küme durumunda 5x5). Eğer özellikle sıra dışı görünmüyorsa (en kötüsü arayan kişi) diyelim ki, normallikle tutarlı bir şekilde tutarlıdır.
Gözüme bakarsak, merkezdeki "Z" veri seti kabaca "o" ve "v" ile eşit ve hatta belki "h" ile aynı, "d" ve "f" ise biraz daha kötü görünüyor. "Z" gerçek veridir. Bir an için normal olduğuna inanmıyorum, ancak normal verilerle karşılaştırdığınızda sıra dışı görünmüyor.
[Düzenleme: Sadece rastgele bir anket yürüttüm - iyi, kızıma sordum, ancak oldukça rastgele bir zamanda - ve en az düz bir çizgi için olan seçimi "d" idi. Dolayısıyla ankete katılanların% 100'ü "d" nin en garip olduğunu düşündü.]
Daha resmi bir yaklaşım bir Shapiro-Francia testi yapmaktır (QQ-grafiğindeki korelasyona etkili bir şekilde dayanır), ancak (a) Shapiro Wilk testi kadar güçlü değil, ve (b) resmi test cevapları soru (bazen) zaten cevabını bilmen gereken bir soru (verilerinizin dağıtıldığı dağılım tam olarak normal değildir), ihtiyaç duyduğunuz soru yerine (ne kadar da önemli?).
İstenildiği gibi yukarıdaki ekran için kod giriniz. Hiçbir şey fantezi içermez:
z = lm(dist~speed,cars)$residual
n = length(z)
xz = cbind(matrix(rnorm(12*n),nr=n),z,matrix(rnorm(12*n),nr=n))
colnames(xz) = c(letters[1:12],"Z",letters[13:24])
opar = par()
par(mfrow=c(5,5));
par(mar=c(0.5,0.5,0.5,0.5))
par(oma=c(1,1,1,1));
ytpos = (apply(xz,2,min)+3*apply(xz,2,max))/4
cn = colnames(xz)
for(i in 1:25) {
qqnorm(xz[,i],axes=FALSE,ylab= colnames(xz)[i],xlab="",main="")
qqline(xz[,i],col=2,lty=2)
box("figure", col="darkgreen")
text(-1.5,ytpos[i],cn[i])
}
par(opar)
x
(En azından 80'lerin ortasından beri bu tür arsalar yapıyorum. Varsayımlar beklediğinde ve ne zaman yapmadıklarını bilmiyorsanız, tarlaları nasıl yorumlayabilirsiniz?)
Daha fazla gör:
Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, DF ve Wickham, H. (2009) Açıklayıcı veri analizi ve model teşhisi için istatistiksel çıkarım Phil. Trans. R. Soc. A 2009 367, 4361-4383 doi: 10.1098 / rsta.2009.0120