Artıkların normal olarak dağıldığını doğrulamak için hangi testleri kullanıyorum?


20

Artıkların zamana karşı bir grafiğini çizmek gibi görünen bazı verilerim var, neredeyse normal ama emin olmak istiyorum. Hata kalıntılarının normalliğini nasıl test edebilirim?


3
Yakından ilişkili: küçük numuneler için uygun normallik testleri . İşte muhtemel diğer ilgi birkaç soru vardır: -normallik-test ediyor-esasen-yararsız , normallik testi değerinin bir tartışma için, & what-if-artıklar-normalde dağıtılmış-ancak-y-IS- değil , normalliğin doğrusal bir model varsayımı olduğu duygusunu tartışmak / açıklamak için değil .
gung - Monica'yı eski durumuna döndürün

Shapiro Wilk testinin özünde çok yaygın bir yanlış anlaşılma var! H0 lehine doğru anlamı, H0 reddedilemez, ancak DİKKAT! Otomatik olarak "veriler normal olarak dağıtılır" anlamına gelmez !!! Alternatif sonuç "Veriler normal olarak dağıtılmaz" dır.
Joe Hallenbeck

Yanıtlar:


28
  1. Hiçbir test, artıklarınızın normal olarak dağıtıldığını söylemez. Aslında, güvenilir olduklarını bahse girebilirsiniz değil .

  2. Varsayımlarınızı kontrol etmek için hipotez testleri genellikle iyi bir fikir değildir. Senin çıkarsamadan olmayan normallik etkisi genellikle örneklem büyüklüğü * bir fonksiyonu değil, ama bir önem testinin sonucu olduğunu . Gerçek ilgi sorununun cevabı ('bu benim çıkarımımı ne ölçüde etkiledi?') 'Normallikten küçük bir sapma büyük bir örnek büyüklüğünde belirgin olacaktır. Buna uygun olarak, küçük bir örneklem büyüklüğünde normallikten büyük bir sapma anlamlılığa yaklaşmayabilir.

    * (düzenleme eklendi) - aslında bu çok zayıf bir ifade. Normal olmayanlığın etkisi, CLT ve Slutsky teoreminin her ne zaman geçerli olacağı hemen hemen örnek büyüklüğü ile azalırken, normalliği reddetme (ve muhtemelen normal teori prosedürlerinden kaçınma) örnek büyüklüğü ile artar ... normalliksizliği en önemli olanı zaten fark etmediğinde belirleme eğilimindesiniz ... ve test gerçekten önemli olduğunda küçük örneklerde yardımcı olmaz.

    en azından önem seviyesi kadar iyi . Yine de burada büyük örnekleri düşünüyorsak, güç yine de bir sorun olabilir, bu da daha az sorun olabilir.

  3. Etki büyüklüğünü ölçmeye daha çok yaklaşan şey, normal olmayan bir dereceye kadar dereceyi ölçen bazı teşhisler (bir ekran veya bir istatistik). Bir QQ grafiği açık bir göstergedir ve aynı popülasyondan bir numune boyutunda ve farklı bir numune boyutunda QQ grafiği , aynı eğrinin en azından her iki gürültülü tahminidir - kabaca aynı 'normalliksizliği' gösterir; en azından yaklaşık olarak ilgili soruya verilen cevapla monoton olarak ilişkili olmalıdır.

Bir test kullanmanız gerekiyorsa, Shapiro-Wilk muhtemelen başka bir şey kadar iyidir (Chen-Shapiro testi genellikle ortak ilgi alanlarına göre biraz daha iyidir, ancak uygulamalarını bulmak daha zordur) - ancak bir soruya cevap veriyor cevabını zaten biliyor; her reddettiğinizde, yanlış olduğundan emin olabileceğiniz bir cevap veriyor.


4
+1 Glen_b çünkü birkaç iyi puan kazandınız. Ancak uyum iyiliği testlerinin kullanımı konusunda çok olumsuz olmazdım. Örnek boyutu küçük veya orta olduğunda, test normal dağılımdan hafif sapmaları tespit etmek için yeterli güce sahip olmayacaktır. Çok büyük farklılıklar çok küçük p değerlerine neden olabilir (örn. 0.0001 veya daha düşük). Bunlar bir qq grafiğinin görsel gözleminden daha resmi göstergeler olabilir, ancak yine de çok faydalıdır. Ayrıca çarpıklık ve basıklık tahminlerine de bakılabilir. Çok büyük örneklerde uyum iyiliği testlerinin sorunlu olduğu görülmektedir.
Michael R. Chernick

4
Bu durumlarda küçük kalkışlar tespit edilecektir. Analist, pratikte nüfus dağılımının tam olarak normal olmayacağını ve boş hipotezi reddetmenin, dağılımının biraz normal olmadığını söylediği sürece, yoldan sapmayacaktır. Araştırmacı daha sonra, normallik varsayımının testin tespit ettiği hafif bir ayrılma göz önüne alındığında bir endişe olup olmadığını yargılamalıdır. Shapiro-Wilk aslında normallik hipotezine karşı daha güçlü testlerden biridir.
Michael R. Chernick

+1, özellikle # 2 noktasını seviyorum; bu çizgiler boyunca, çarpıklık veya basıklık oldukça kötü olsa bile, gerçekten büyük N / Merkezi Limit Teoremi sizi kapsayacaktır, bu yüzden normalliğe en az ihtiyacınız olan zamandır .
gung - Monica'yı eski durumuna döndürün

3
@gung, normalliğe iyi bir yaklaşımın önemli olacağı bazı durumlar vardır. Örneğin, normal varsayımlar kullanarak tahmin aralıkları oluştururken. Ama yine de bir testten daha fazla bir tanıya (normal olmadığını gösteren)
güvenirim

Tahmin aralıkları hakkındaki görüşünüz iyi.
gung - Monica'yı eski durumuna döndürün

8

Shapiro-Wilk testi bir olasılıktır.

Shapiro-Wilk testi

Bu test neredeyse tüm istatistiksel yazılım paketlerinde uygulanır. Boş hipotez, artıkların normal olarak dağıtıldığıdır, bu nedenle küçük bir p değeri, sıfırın reddedilmesi ve artıkların normal olarak dağıtılmadığı sonucuna varmanız gerektiğini gösterir.

Örnek büyüklüğünüz büyükse neredeyse her zaman reddedeceğinizi unutmayın, bu nedenle artıkların görüntülenmesi daha önemlidir.


"Wilk" değil "Wilk" dir.
Michael R. Chernick

1

Vikipedi'den:

Tek değişkenli normalite testleri arasında D'Agostino'nun K-kare testi, Jarque-Bera testi, Anderson-Darling testi, Cramér-von Mises kriteri, Lilliefors normallik testi (kendisi Kolmogorov-Smirnov testinin bir uyarlaması), Shapiro – Wilk testi, Pearson ki-kare testi ve Shapiro – Francia testi. İstatistiksel Modelleme ve Analitik Dergisi'nin [1] 2011 tarihli bir makalesinde, Shapiro-Wilk'un belirli bir önem için en iyi güce sahip olduğu ve Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors ve Anderson- Sevgilim testleri.


1
-1: Wikipedia sayfasına bir bağlantı eklemek, dipnotu kaldırmak ("[1]") ve blok alıntı işlevini kullanmak isteyebilirsiniz.
Bernd Weiss

1
Glen_b'in verdiği uyarı, bu uyum iyiliği testlerinden herhangi biri kullanıldığında akılda tutulması önemlidir. Sanırım Shapiro-Wilk hakkında kaka yaptığınız sonuç, ortaya çıkardığınız kadar genel değil. Normallik için küresel olarak en güçlü bir test olduğuna inanmıyorum.
Michael R. Chernick

2
n1

@GregSnow Paketinizi ayrıntılı olarak inceleyecek zamanım yok ve her şeyi takip etmek için R ile yeteri kadar uzman olmayabilirim. Normallik için küresel olarak en güçlü bir test olduğunu mu söylüyorsunuz, yoksa çeşitli testlerin en güçlü olduğunu ve dolayısıyla küresel bir testin bulunmadığını göstermek için örnekler verdiğinizi mi söylüyorsunuz? Birinin var olduğuna dair şüphelerim var ve Shapiro-Wilk'un olacağını sanmıyorum. Birinin var olduğunu iddia ediyorsanız, matematiksel bir kanıt veya referansa bakmak istiyorum.
Michael R. Chernick

1
@MichaelChernick, benim iddiam, testimin diğer herhangi bir normallik testi kadar fazla veya daha fazla güce sahip olacağı (tam bir normalden gelen verilerin boş hipotezini reddetme olasılığı veya daha fazla olması). R kodunu takip etmek zor değil, p değerini hesaplamak için temel kod "tmp.p <- ise (varsa (israsyonel (x))) {0" ise, gücünün kanıtı açık olmalıdır ( Sadece güçlü olduğunu ve belgelerin yararlı olabileceğini iddia ettim, testin kendisinin yararlı olmadığını değil, "Cochrane'nin aforizması" için google).
Greg Snow
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.