Shapiro-Wilk testinin yorumlanması


29

İstatistikler konusunda oldukça yeniyim ve yardımınıza ihtiyacım var.
Aşağıdaki gibi küçük bir örnek var:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

Shapiro-Wilk testini R kullanarak yaptım.

shapiro.test(precisionH4U$H4U)

ve şu sonucu aldım:

 W = 0.9502, p-value = 0.6921

Şimdi, anlamlılık seviyesini p 'de 0,05 değerinden daha yüksek olduğunu kabul edersem, alfa (0,6921> 0,05)' i kabul ediyorum ve normal dağılım hakkındaki boş hipotezi reddedemem, ancak numunenin normal bir dağılıma sahip olduğunu söylememe izin veriyor mu? ?

Teşekkürler!

Yanıtlar:


28

Hayır - "örnek normal dağılıma sahip" veya "örnek normal dağılıma sahip bir popülasyondan geliyor" diyemezsiniz, ancak yalnızca "örneğin normal dağılıma sahip bir popülasyondan geldiği hipotezini reddedemezsiniz" diyemezsiniz.

Aslında, numunenin normal bir dağılımı yoktur ( aşağıdaki qqplot'a bakınız), ancak bunun sadece bir örnek olması beklenmez. Altta yatan nüfusun dağılımı ile ilgili soru açık kalmaktadır.

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
qqplot oldukça normal görünüyor sanırım ... qqnorm(rnorm(9))birkaç kez deneyebilirsiniz ...
Meraklı

2
@ Toms: Belki de "qqplot normal bir popülasyondan gelmiş gibi görünüyor" demek daha iyidir. Bunun yerine daha ağır kuyruklu bir dağıtımdan gelebilirdi.
Henry

Evet, qqnorm(runif(9))benzer sonuç üretebilir. Yani aslında hiçbir şey söyleyemeyiz ...
Meraklı

“Örnek normal dağılıma sahip” ve “örnek normal dağılıma sahip bir popülasyondan geliyor” arasındaki fark nedir?
auraham

1
Normal bir dağılım, tüm gerçekler üzerinde sürekli bir dağılımdır. Bir örnek (sonlu hatta sayılabilir bir şekilde sonsuz), bu dağılıma sahip bir popülasyondan alınmış olsa bile, bu tür bir dağılıma sahip olamaz.
Henry,

17

Boş bir hipotezi reddetmekte başarısız olmak, sahip olduğunuz numunenin normaliteden ne gibi sapmalar saptamak için çok küçük olduğuna dair bir göstergedir - ancak numuneniz normalden büyük ölçüde sapmalar tespit edilemeyecek kadar küçüktür.

Aslında test ettiğiniz sorunun cevabını biliyorum - - Ancak bir hipotez testi hemen hemen çoğu durumda konunun dışında insanlar için bir normallik testi kullanmasıdır çizilir Verilerinizden nüfus dağılımı olduğu değil , normal olacak . (Bazen oldukça yakın olabilir, ama aslında normal mi?)

İlgilenmeniz gereken soru 'normalden elde ettikleri dağılımdır' değildir (olmayacak). Asıl dikkat etmeniz gereken soru daha çok 'sonuçlarımda maddi olarak etkileyeceğim normallikten sapma mı?' Gibi. Bu potansiyel olarak bir sorunsa, bu soruna sahip olma olasılığı daha düşük olan bir analiz düşünebilirsiniz.


10

İstatistikler konusunda oldukça yeni olduğunuz düşünülürse, bunu düşündüğünüzden şüpheleniyorum, çünkü bunlar bir ortalama tahmininin kalıntılarıdır ve normallik varsayımının dağıtımı kullanarak güven tahminleri için geçerli olup olmadığını bilmek istiyorsunuz .t

t -test, veri Henry'nin qq arsa içinde belli belirsiz, normal bu varsayımın ihlalleri oldukça sağlam bakmak, ve ben o a söyleyebilirim böylece Shapiro testi, veri olmayan normal dağılıma sahip bir nüfusa geldiğini göstermez testi uygundur.t

Ayrıca, oranlara baktığınızı, bu durumda varsayımların ihlali konusunda endişe duyduğunuzda binom dağılımını kullanabileceğinizi tahmin ediyorum.

Seni Shapiro testlerine götüren başka bir endişeydi, az önce söylediğim her şeyi görmezden gelebilirsin.


Doğru yaptın, örneğim için t testi kullanıp kullanamayacağımı bilmek istedim. Teşekkürler!
Jakub

4

Henry'nin dediği gibi normal olduğunu söyleyemezsin. Aşağıdaki komutu birkaç kez R ile birkaç kez çalıştırmayı deneyin:

shapiro.test(runif(9)) 

Bu düzgün dağılımdan 9 sayı örneğini test edecektir. Çoğu zaman p değeri 0,05'ten çok daha büyük olacaktır - bu, dağılımın normal olduğu sonucuna varamayacağınız anlamına gelir.


4

Ayrıca Shapiro-Wilk testinde W değerini nasıl doğru yorumlayabileceğime ve Emil OW Kirkegaard'ın " Shapiro-Wilk testindeki W değerleri farklı veri kümeleriyle görselleştirildi " makalesine göre bir normalin hakkında bir şey söylemek çok zor. Sadece W değerine bakarak dağılım .

Sonuç olarak belirttiği gibi:

Genel olarak, büyük bir örneklem verildiğinde, SW'nin normallikten ayrılmalara duyarlı olduğunu görüyoruz. Kalkış çok küçük ise, ancak çok önemli değil.

Ayrıca, kasıtlı olarak denemesine rağmen W değerini düşürmenin zor olduğunu görüyoruz. Biri, kayda değer bir şekilde, 99'un altına düşmesi için aşırı derecede normal olmayan dağılımları test etmek zorundadır.

Daha fazla bilgi için orijinal makaleye bakın.


1

Önceki cevaplarda belirtilmeyen önemli konulardan biri test sınırlamalarıdır:

Testin sınırlamaları vardır, en önemlisi testin numune büyüklüğüne göre bir önyargısına sahip olmasıdır . Örnek büyüdükçe, istatistiksel olarak anlamlı bir sonuç elde etme olasılığınız artar.

Orijinal soruyu cevaplamak için (çok küçük örneklem büyüklüğü): bu özel durum için QQ grafiği ve histogram gibi daha iyi alternatifler hakkında aşağıdaki makalelere bakın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.