Bir Kutu ve Bıyık grafiği için bir aykırı standart tanımı aralığının dışındaki noktalardır ; burada ve ilk çeyrek ve verinin üçüncü çeyreğidir.
Bu tanımın temeli nedir? Çok sayıda nokta ile mükemmel bir normal dağılım bile aykırı değerlere geri döner.
Örneğin, diziyle başladığınızı varsayalım:
xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025)
Bu dizi 4000 puanlık bir veri yüzdesi oluşturur.
qnorm
Bu serinin için normalliği test etmek şöyle sonuçlanır:
shapiro.test(qnorm(xseq))
Shapiro-Wilk normality test
data: qnorm(xseq)
W = 0.99999, p-value = 1
ad.test(qnorm(xseq))
Anderson-Darling normality test
data: qnorm(xseq)
A = 0.00044273, p-value = 1
Sonuçlar tam olarak beklendiği gibidir: normal dağılımın normalliği normaldir. Bir Oluşturma qqnorm(qnorm(xseq))
(beklendiği gibi) verilerin düz bir çizgi oluşturur:
Aynı verilerin bir kutu grafiği oluşturulursa, boxplot(qnorm(xseq))
sonuç oluşturulur :
Kutu boyutu, aksine shapiro.test
, ad.test
veya örnek boyutu yeterince büyük olduğunda (bu örnekte olduğu gibi) birkaç noktayı aykırı olarak qqnorm
tanımlar .