Shapiro-Wilk normallik testi ile Kolmogorov-Smirnov normallik testi arasındaki fark nedir? Bu iki yöntemin sonuçları ne zaman farklılık gösterecek?
Shapiro-Wilk normallik testi ile Kolmogorov-Smirnov normallik testi arasındaki fark nedir? Bu iki yöntemin sonuçları ne zaman farklılık gösterecek?
Yanıtlar:
Kolmogorov-Smirnov, tam olarak belirlenmiş bir dağıtım için olduğu için ikisini bile karşılaştıramazsınız (bu nedenle normallik testi yapıyorsanız, ortalama ve varyansı belirtmelisiniz; verilerden tahmin edilemezler *). Shapiro-Wilk belirtilmemiş ortalama ve varyans ile normalite içindir.
* Ayrıca tahmini parametreleri kullanarak standardize edemez ve standart normal için test edebilirsiniz; bu aslında aynı şey.
Karşılaştırma yapmanın bir yolu, Shapiro-Wilk'i normalde belirtilen ortalama ve varyans için bir testle (testleri bir şekilde birleştirerek) ya da KS tablolarını parametre kestirimi için ayarlanmış hale getirerek (ancak daha sonra dağılım değil) yapmaktır. -ücretsiz).
Böyle bir test var (tahmini parametrelerle Kolmogorov-Smirnov'a eşdeğer) - Lilliefors testi; Normallik testi sürümü geçerli olarak Shapiro-Wilk ile karşılaştırılabilir (ve genellikle daha düşük güce sahip olacaktır). Daha rekabetçi olan Anderson-Darling testidir (karşılaştırmanın geçerli olması için parametre tahmini için de ayarlanması gerekir).
Test ettiklerine gelince - KS testi (ve Lilliefors) ampirik CDF ile belirtilen dağılım arasındaki en büyük farka bakarken, Shapiro Wilk iki varyans tahminini etkili bir şekilde karşılaştırırken; yakından ilişkili Shapiro-Francia, QQ arsadaki kare korelasyonun monotonik bir fonksiyonu olarak görülebilir; Doğru hatırlıyorsam, Shapiro-Wilk sipariş istatistikleri arasındaki kovaryansları da dikkate alıyor.
[Normallik için bunlardan daha fazla mevcut olan daha birçok test olduğu unutulmamalıdır.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- p-değerleri olması gerektiği gibi olsaydı, düzgün görünüyordu!
Kısaca, Shapiro-Wilk testi normallik için özel bir testtir, oysa Kolmogorov-Smirnov testi tarafından kullanılan yöntem daha genel, ancak daha az güçlüdür (yani, normalliğin boş hipotezini doğru şekilde reddeder). Her iki istatistik de null olarak normallik kazanır ve örneğe dayanan bir test istatistiği oluşturur, ancak bunların normal dağılım özelliklerine daha az veya daha az duyarlı hale gelmelerinde birbirlerinden farklıdır.
Tam olarak W'nin (Shapiro-Wilk için test istatistiği) nasıl hesaplandığını biraz içerir, ancak kavramsal olarak, örnek değerlerini boyutuna göre sıralamayı ve beklenen araçlara, varyanslara ve kovaryanslara karşı uygunluğu ölçmeyi içerir. Normallikle yapılan bu çoklu karşılaştırmalar, benim anladığım gibi, sınava, farklılık gösterebilecekleri bir yol olan Kolmogorov-Smirnov sınavından daha fazla güç veriyor.
Aksine, Kolmogorov-Smirnov'un normallik testi, beklenen kümülatif dağılımı ampirik kümülatif dağılımla karşılaştırarak, uyum iyiliğini değerlendirmek için genel bir yaklaşımdan türetilmiştir:
Bu nedenle, dağıtımın merkezinde, kuyruklara duyarlı değil. Bununla birlikte, KS testi yakınsaktır, n'nin sonsuzluğa eğilimi olduğu gibi, testin olasılıktaki gerçek cevaba yakınsadığıdır ( Glivenko-Cantelli Teoremi'nin burada geçerli olduğuna inanıyorum , ancak biri beni düzeltebilir). Bunlar, bu iki testin normallik değerlendirmesinde farklı olabileceği iki yoldur.