Artıkların zamana karşı bir grafiğini çizmek gibi görünen bazı verilerim var, neredeyse normal ama emin olmak istiyorum. Hata kalıntılarının normalliğini nasıl test edebilirim?
Artıkların zamana karşı bir grafiğini çizmek gibi görünen bazı verilerim var, neredeyse normal ama emin olmak istiyorum. Hata kalıntılarının normalliğini nasıl test edebilirim?
Yanıtlar:
Hiçbir test, artıklarınızın normal olarak dağıtıldığını söylemez. Aslında, güvenilir olduklarını bahse girebilirsiniz değil .
Varsayımlarınızı kontrol etmek için hipotez testleri genellikle iyi bir fikir değildir. Senin çıkarsamadan olmayan normallik etkisi genellikle örneklem büyüklüğü * bir fonksiyonu değil, ama bir önem testinin sonucu olduğunu . Gerçek ilgi sorununun cevabı ('bu benim çıkarımımı ne ölçüde etkiledi?') 'Normallikten küçük bir sapma büyük bir örnek büyüklüğünde belirgin olacaktır. Buna uygun olarak, küçük bir örneklem büyüklüğünde normallikten büyük bir sapma anlamlılığa yaklaşmayabilir.
* (düzenleme eklendi) - aslında bu çok zayıf bir ifade. Normal olmayanlığın etkisi, CLT ve Slutsky teoreminin her ne zaman geçerli olacağı hemen hemen örnek büyüklüğü ile azalırken, normalliği reddetme (ve muhtemelen normal teori prosedürlerinden kaçınma) örnek büyüklüğü ile artar ... normalliksizliği en önemli olanı zaten fark etmediğinde belirleme eğilimindesiniz ... ve test gerçekten önemli olduğunda küçük örneklerde yardımcı olmaz.
en azından önem seviyesi kadar iyi . Yine de burada büyük örnekleri düşünüyorsak, güç yine de bir sorun olabilir, bu da daha az sorun olabilir.
Etki büyüklüğünü ölçmeye daha çok yaklaşan şey, normal olmayan bir dereceye kadar dereceyi ölçen bazı teşhisler (bir ekran veya bir istatistik). Bir QQ grafiği açık bir göstergedir ve aynı popülasyondan bir numune boyutunda ve farklı bir numune boyutunda QQ grafiği , aynı eğrinin en azından her iki gürültülü tahminidir - kabaca aynı 'normalliksizliği' gösterir; en azından yaklaşık olarak ilgili soruya verilen cevapla monoton olarak ilişkili olmalıdır.
Bir test kullanmanız gerekiyorsa, Shapiro-Wilk muhtemelen başka bir şey kadar iyidir (Chen-Shapiro testi genellikle ortak ilgi alanlarına göre biraz daha iyidir, ancak uygulamalarını bulmak daha zordur) - ancak bir soruya cevap veriyor cevabını zaten biliyor; her reddettiğinizde, yanlış olduğundan emin olabileceğiniz bir cevap veriyor.
Shapiro-Wilk testi bir olasılıktır.
Bu test neredeyse tüm istatistiksel yazılım paketlerinde uygulanır. Boş hipotez, artıkların normal olarak dağıtıldığıdır, bu nedenle küçük bir p değeri, sıfırın reddedilmesi ve artıkların normal olarak dağıtılmadığı sonucuna varmanız gerektiğini gösterir.
Örnek büyüklüğünüz büyükse neredeyse her zaman reddedeceğinizi unutmayın, bu nedenle artıkların görüntülenmesi daha önemlidir.
Vikipedi'den:
Tek değişkenli normalite testleri arasında D'Agostino'nun K-kare testi, Jarque-Bera testi, Anderson-Darling testi, Cramér-von Mises kriteri, Lilliefors normallik testi (kendisi Kolmogorov-Smirnov testinin bir uyarlaması), Shapiro – Wilk testi, Pearson ki-kare testi ve Shapiro – Francia testi. İstatistiksel Modelleme ve Analitik Dergisi'nin [1] 2011 tarihli bir makalesinde, Shapiro-Wilk'un belirli bir önem için en iyi güce sahip olduğu ve Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors ve Anderson- Sevgilim testleri.