Şimdiye kadar, küçük örneklerde normallik varsayımlarını test etmek için Shapiro-Wilk istatistiği kullanıyorum.
Başka bir teknik önerebilir misiniz?
Şimdiye kadar, küçük örneklerde normallik varsayımlarını test etmek için Shapiro-Wilk istatistiği kullanıyorum.
Başka bir teknik önerebilir misiniz?
Yanıtlar:
FBasics R (parçası paket Rmetrics ) içeren çok sayıda normallik testleri popüler çoğunu kapsayan, frequentist testleri normallik testleri için bir sarıcı ile birlikte - Kolmogorov-Smirnov, Shapiro-Wilk, Jarque-Bera ve D'Agostino - en kuzeydeki pakette - Anderson – Darling, Cramer – von Mises, Lilliefors (Kolmogorov-Smirnov), Pearson ki kare ve Shapiro – Francia. Paket dokümantasyonu ayrıca tüm önemli referansları sağlar. İşte testlerin en kuzeyden nasıl kullanılacağını gösteren bir demo .
Zamanınız varsa, bir yaklaşım birden fazla test kullanmak ve anlaşma olup olmadığını kontrol etmektir. Testler çeşitli şekillerde farklılık gösterir, bu nedenle "en iyi" yi seçmek tamamen kolay değildir. Alanınızdaki diğer araştırmacılar ne kullanıyor? Bu değişebilir ve diğerlerinin çalışmanızı kabul etmesi için kabul edilen yöntemlere bağlı kalmak en iyisi olabilir. Sık sık Jarque-Bera testini kısmen bu nedenle ve Anderson – Darling'i karşılaştırma için kullanıyorum.
Sen bakabilirsiniz "Tekdeğişkenli Normallik için Testler Karşılaştırılması" (2002 Seier) ve "normallik çeşitli testlerin karşılaştırılması" konularında bir karşılaştırması ve tartışma için; (2007 Yolaçan Yazıcı'nın).
Tüm dağıtım fonksiyonları sayesinde, bu yöntemleri R'de karşılaştırmak için test etmek de önemsizdir . Simüle edilmiş verilerle basit bir örnek (yerden tasarruf etmek için sonuçları yazdırmayacağım), ancak daha tam bir açıklama gerekli olacaktır:
library(fBasics); library(ggplot2)
set.seed(1)
# normal distribution
x1 <- rnorm(1e+06)
x1.samp <- sample(x1, 200)
qplot(x1.samp, geom="histogram")
jbTest(x1.samp)
adTest(x1.samp)
# cauchy distribution
x2 <- rcauchy(1e+06)
x2.samp <- sample(x2, 200)
qplot(x2.samp, geom="histogram")
jbTest(x2.samp)
adTest(x2.samp)
Farklı dağılımlar üzerinde yapılan çeşitli testlerin sonuçlarını aldıktan sonra, hangilerinin en etkili olduğunu karşılaştırabilirsiniz. Örneğin, yukarıdaki Jarque-Bera testi için p değeri normal dağılım (kabul) için 0.276 ve cauchy için (2.2 hipotezi reddederek) <2.2e-16 döndürdü.
Normallik için, gerçek Shapiro-Wilk oldukça küçük numunelerde iyi bir güce sahiptir.
Gördüğüm çalışmalarda ana rakip, daha iyi olan daha genel Anderson-Darling, ancak daha iyi olduğunu söyleyemem. Hangi alternatiflerin ilginizi çektiğini netleştirebilirseniz, muhtemelen daha iyi bir istatistik daha açık olacaktır. [değiştir: parametreleri tahmin ederseniz, AD testi bunun için ayarlanmalıdır.]
[Küçük örneklerde (muhtemelen istatistiksel çevrelerde Bowman-Shenton olarak bilinen - küçük örnek dağılımını incelediler) Jarque-Bera'ı dikkate almamanızı şiddetle tavsiye ederim. Asimetrik eklem çarpıklığı ve basıklık dağılımı küçük örnek dağılımına benzemez - aynı şekilde bir muz da portakal gibi görünmez. Ayrıca bazı ilginç alternatiflere karşı çok düşük bir güce sahiptir - örneğin normal bir dağılıma yakın basıklık gösteren simetrik bir bimodal dağılımını almak için düşük güce sahiptir.]
Çoğu zaman insanlar, özellikle iyi olmayan nedenlerle ortaya çıkan uyum iyiliğini test ederler veya gerçekten cevaplamak istedikleri sorudan başka bir soruya cevap verirler.
Örneğin, neredeyse kesinlikle verilerinizin gerçekten normal olmadığını biliyorsunuz (tam olarak değil), bu yüzden cevabını bildiğiniz bir soruyu cevaplamaya çalışmanın bir anlamı yoktur - ve hipotez testi aslında buna cevap vermez .
Zaten kesin bir normalliğe sahip olmadığınızı bildiğinizde, normalite hipotez testiniz size "sahip olduğum normal olmayanlık miktarını alabilecek kadar büyük bir soruya" daha yakın bir soruya gerçekten cevap veriyor. cevaplamakla ilgilendiğiniz asıl soru genellikle " bu normal olmamanın ilgilendiğim diğer şeyler üzerindeki etkisi nedir?" sorusuna daha yakındır . Hipotez testi örneklem büyüklüğünü ölçerken, cevaplamak istediğiniz soru örneklem büyüklüğüne bağlı değildir.
Normallik testinin bir anlam ifade ettiği zamanlar vardır, ancak bu durumlar neredeyse hiç küçük örneklerle gerçekleşmez.
Neden normalliği test ediyorsunuz?
Normallik testlerinde aşağıdakileri içeren bir Wikipedia kategorisi vardır :
Sanırım AD muhtemelen en iyisi.
Bütünlük için, ekonometristler aynı zamanda Ekonomi Mektupları'ndaki 1983 makalelerinden Kiefer ve Somon testini severler - daha sonra ki-kare dağıtılan 'normalleştirilmiş' çarpıklık ve basıklık ifadelerini toplar. Gradyan okulunda yazdığım eski bir C ++ sürümüm var.
Düzenleme: Ve işte son zamanlarda Jarque-Bera ve Kiefer-Salmon'u türeyen Bierens (re-) 'nin makalesi.
Edit 2: Eski koda baktım ve Jarque-Bera ile Kiefer-Salmon arasında gerçekten aynı test olduğu anlaşılıyor.
Aslında Kiefer Somon testi ve Jarque Bera testi birkaç yerde gösterildiği gibi kritik olarak farklıdır, ancak en son burada - Standart Hata Dağılımları için Moment Testleri: Yi-Ting Chen tarafından yapılan Basit Sağlam Bir Yaklaşım . Kiefer Salmon testi, standart Jarque Bera testinden farklı olarak ARCH tipi hata yapıları karşısında sağlamdır. Yi-Ting Chen'in makalesi, şu anda en iyi testler olacağını düşündüğüm şeyi geliştiriyor ve tartışıyor.
<30 denek örnek boyutları için , Shapiro-Wilk'ın güçlü bir güce sahip olduğu kabul edilir - Testin önem seviyesini ayarlarken, tip II hataya neden olabileceğinden dikkatli olun ! [1]