Tüm normallik testleri null hipotezi reddeder?


12

Kolgomorov-Smirnov testi, Shapiro testi, vs ... hepsi dağılımın normal olduğu hipotezini reddediyor. Yine de normal nicelikleri ve histogramı çizdiğimde veriler açıkça normaldir. Belki testlerin gücü yüksek olduğu için?

Örneklem büyüklüğü yaklaşık 650'dir. Bu testlerden en az biri sıfır hipotezini reddedemez mi?

Sonuçlar:

           Kolmogorov-Smirnov    D          0.05031          Pr > D       <0.010
           Cramer-von Mises      W-Sq       0.30003          Pr > W-Sq    <0.005
           Anderson-Darling      A-Sq       1.66965          Pr > A-Sq    <0.005
           Chi-Square            Chi-Sq  3250.43596     18   Pr > Chi-Sq  <0.001

1
Siteye hoş geldiniz. Güç gerçekten bir sorun olabilir. Daha spesifik olabilmemiz için sonuçlarınızı gönderebilir misiniz?
StasK

1
Bir histograma veya miktarlara bakarak normalliği çok doğru bir şekilde değerlendirmek neredeyse imkansız. Bu testlerin ilk üçü bir olasılık grafiğindeki (Normal qq grafiği) sapmaları ölçer, peki bu grafik nasıl doğrusal görünüyor?
whuber

Yanıtlar:


13

Normallik testi zaman kaybıdır ve örneğiniz bunun nedenini göstermektedir. Küçük örneklerde normallik testi düşük güce sahiptir, bu nedenle hangi istatistiksel modellerin kullanılacağına ilişkin kararların a priori bilgiye dayanması gerekir . Bu durumlarda null değerinin reddedilmemesi null değerinin nüfus düzeyinde yaklaşık olarak doğru olduğunu kanıtlamaz .

Büyük örnekleriniz olduğunda, normallik testleri gülünç derecede güçlü hale gelir, ancak size zaten bilmediğiniz bir şey söylemezler. Hiçbir gerçek miktar olduğunu tam olarak normal dağılıma sahip. Normal dağılım sadece bir çok durumda yeterince iyi bir yaklaşım olan matematiksel bir soyutlamadır. Bunun en basit kanıtı, herhangi bir gerçek sayıyı değeri olarak alabilecek gerçek bir miktar (en azından aklıma gelen hiçbir şey) olmadığıdır . Örneğin, evrende çok fazla molekül vardır. Para arzında çok fazla dolar var. Işık hızı sonludur. Bilgisayarlar yalnızca sonlu boyuttaki sayıları depolayabilir, bu nedenle bir şey tüm gerçek sayıları desteklese bile ölçemezsiniz.

Mesele şu ki, verilerinizin normalde tam olarak dağıtılmadığını biliyorsunuzdur, ancak normallik testleri size verilerin ne kadar normal olmadığı hakkında hiçbir şey söylemez. Onlar kesinlikle hiçbir veri olup olmadığı konusunda ipucu vermek yaklaşık normalde normallik varsayalım istatistiksel çıkarsama yöntemleri doğru cevap verecek şekilde dağıtılmış. İronik olarak, normalliği kabul eden yaygın testler (örn. T testi ve ANOVA) büyük örneklem boyutlarında normallik için daha sağlamdır.


Cevabınızı takiben, normalliksizliğin iyi bir endeksini neyin oluşturduğu hakkında bir soru gönderdim: stats.stackexchange.com/questions/16646/… Herhangi bir düşünce?
Jeromy Anglim

Dünyadaki her şeyin nicelleştirilmesi ile ilgili olarak: ayrık veriler normal olarak da dağıtılamaz mı?
xmjx

Bilgisayar sorunu hakkında bir yorum daha: ondalık sayıları bilgisayarlarda saklamak için sıklıkla kullanılan mekanizmanın küçük sayılar ve büyük sayılar için farklı bir ayrıntıya sahip olduğunu lütfen unutmayın. Böylece bilgisayarın depolayabileceği sayılar arasındaki minimum fark küçük sayılar için daha küçük ve büyük sayılar için daha büyüktür. Bir bilgisayar için 100000.1 ve 100000.2 aynı olabilir, ancak 0.1 ve 0.2 değildir. (Sadece bir örnek - gerçek dünyada o kadar da kötü değil.)
xmjx

@xmjx: Ayrık veriler yaklaşık olarak normal olarak dağıtılabilir, yani neredeyse her pratik amaç için yeterince yakındır. Bununla birlikte, teoride, eğer numune boyutu yeterince büyükse, herhangi bir ayrık dağılım normallik için bazı testlerde başarısız olacaktır. Normal dağılım süreklidir ve bunun hiçbir yolu yoktur.
dsimcha

@dsimcha Ancak normal dağılım, belirli bir değişkenin belirli bir bölmesindeki gözlem sayısını tahmin edebilecek bir olasılık yoğunluk fonksiyonudur. Yani, "hiçbir gerçek değişken tam olarak normal olarak dağıtılmaz ve normalde bu noktada normallik testleri başarısız olur" derseniz, anlıyorum. Ancak "ayrık veriler normal olmadığından sürekli dağıtılamaz" için bazı referanslar istiyorum. Bu tür şeylerle gerçekten ilgileniyorum. Burada kavga etmek istemiyorum.
xmjx

4

Bu beni şaşırtmıyor - yeterince büyük bir örneklem büyüklüğü ile, veri üreten dağıtım gerçekten (ve tam olarak) normal olmadığı sürece, herhangi bir iyi test sıfır hipotezini reddetmelidir.

Hipotez testi ile, genellikle sıfır hipotezinden olabildiğince az veriyle çok küçük sapmalar bulabilen bir test olan "güçlü" bir test bulmakla ilgilenir.

Testi 20, 50, 100, 200 boyutunda bir alt örnekle çalıştırmayı deneyin ve testlerin hangi boyutta reddetmeye başladığını görün. Bir histogramın simetrik ve genellikle çan şeklinde olup olmadığını görmek kolaydır, ancak dağılımın kuyruklarını gözle değerlendirmek daha zordur. Belki de verilerde testlerin reddedilmesine neden olan aykırı değerler vardır? Varsa, onları budanırsanız ne olacağını görün.


Cevap için teşekkürler. Amaç, artıkların normal olup olmadığını test etmektir. Ben normal bir kantil arsa bakarak ve y = x yatıyor görmek en iyi bahis olduğunu tahmin?
Robbie

@Robbie Eğer artıklarınızın normal olup olmadığını anlamaya çalışmak istiyorsanız, görsel bir inceleme iyi olmalıdır. Bunun için dağıtımın istatistiksel testi gerçekten gerekli değildir - belirtildiği gibi, normalden herhangi bir sapma, hatta gerçekten önemli olmayan bir sapma alacaktır.
Fomite

@EpiGrad Katılıyorum. Normallik testleri kötü bir şekilde düşük güce sahiptir. Yukarıdaki cevabımı gör. Düzenleme Ben normal görünüyorsa, bu amaçla muhtemelen iyiyiz kabul ediyorum böylece diğer taraftan, regresyon olmayan normale oldukça sağlamdır.
David J. Harris

@David J. Harris: "Çok düşük güç" mü? 650 örnek boyutları için? Bu, okuduğum veya yaşadığım her şeye aykırı. Atıfın var mı?
whuber

@ DavidJ.Harris Bence çekirdek, düşük güç veya büyük bir örnek nedeniyle sahte önemi, tüm egzersiz normallik varsayımının rutin incelemesi için gereksizdir.
Fomite

3

Olası neden, verilerinizin çok az normal olmaması ve örnekleminizin boyutunun bunu ortaya çıkaracak kadar büyük olmasıdır.

Eğer dağılım gerçekten normalse, testlerden biri hariç tümünün geçtiği aşağıdaki R örneğinde olduğu gibi genellikle bu testleri geçmelidir.

> require(nortest)
> 
> set.seed(1)
> dat <- rnorm(650,mean=100, sd=5)
> 
> ad.test(dat)

        Anderson-Darling normality test

data:  dat 
A = 0.439, p-value = 0.2924

> cvm.test(dat)

        Cramer-von Mises normality test

data:  dat 
W = 0.0882, p-value = 0.1619

> lillie.test(dat)

        Lilliefors (Kolmogorov-Smirnov) normality test

data:  dat 
D = 0.0334, p-value = 0.08196

> pearson.test(dat)

        Pearson chi-square normality test

data:  dat 
P = 37.96, p-value = 0.035

> sf.test(dat)

        Shapiro-Francia normality test

data:  dat 
W = 0.9978, p-value = 0.5186

> shapiro.test(dat)

        Shapiro-Wilk normality test

data:  dat 
W = 0.9981, p-value = 0.675

Bir qqplot yapmak isteyebilirsiniz ve bu düz bir çizgiye yeterince yakınsa, bunu amaçlarınız için normalliğe yeterince yakın olarak değerlendirmeye karar verebilirsiniz. Daha ziyade bu amaçların ne olduğuna bağlıdır.


Amaçlar, lineer regresyonda artıkların normal olup olmadığını test etmek içindir.
Robbie

1
@Robbie. Görünüşe göre öyle değiller, ama bunun çok önemli olmaması için yeterince yakın olabilirler. Qqplot'u deneyin.
Henry

Pearson ki kare sonucu, verilerin normal olarak dağıtılmadığı görülüyor. Sadece söylüyorum. Böyle bir sonuçla ne yapmalı?
xmjx

@xmjx: Fazla değil - 0.05 ölçütü uygularsanız,% 5 oranında yanlış pozitif alırsanız şaşırmamalısınız.
Henry

@ Henry biliyorum. Demek istediğim: Herhangi bir normallik testinin önceden seçilmesinin "önemli" diyecek bir tane seçme olasılığı vardır. Pili çalıştırmak daha iyi ve sonra ... ne? Ortalama? Çoğunluk oyuyla mı gidiyorsunuz?
xmjx

2

Dsimcha'nın cevabına katılmama izin verin: "Normallik testi zaman kaybıdır ve örneğiniz bunun nedenini göstermektedir." Normallik testi asla zaman kaybı değildir, her zaman verilerinizden öğrenebilirsiniz. Ayrıca, bazı analizler yapmadan önce test etmeniz gereken bazı durumlar vardır (örn. ANOVA, regresyon vb.). Nispi büyük numune boyutlarının çizim (QQplot, histogram) ile test edilmesi daha iyidir. Bu gibi durumlarda, görselleştirme multimodal davranışlar vb. Hakkında çok daha fazla bilgi verir.

ANOVA ve regresyon, büyük örnek boyutları ele alınırken normalliklere karşı dayanıklıdır, ancak sorunlara neden olan ana veri türü çok modlu veri örnekleridir.

Küçük örneklem büyüklüğü ile Kolgomorov-Smirnov testi esas olarak hassasiyeti nedeniyle en iyi seçenektir.


1

Şimdiye kadar yayınlanan diğer cevaplara biraz katılmayacağım: normallik için yapılan bu testler, en azından belirli sapmalar için, nispeten büyük örnek boyutlarında bile, az sayıda güce sahiptir.

İşte kısa bir örnek. Ortalamaları sd ile ayrılan iki normalin bir karışımını oluşturdum.

set.seed(1)
reps = replicate(
  10000, 
  shapiro.test(c(rnorm(325, mean = 0), rnorm(325, mean = 1)))$p.value
)
mean(reps < .05)
[1] 0.0525

Gerçekten normal olsa bile% 5 oranında normallik sapmalarını "algılayacağı" düşünüldüğünde, bu çok etkileyici değildir.

Başka bir örnek: İki standart sapmanın boyutuna bir aralıkta düzgün gürültü ekliyorum. Bu oldukça gözle görülür bir şekilde normal değil.

set.seed(1)
reps = replicate(
  10000, 
  shapiro.test(rnorm(650) + 2 * runif(650))$p.value
)
mean(reps < .05)
[1] 0.0523

Yine, normallikten oldukça büyük bir ayrılma için son derece düşük güç.

Qqplot'u doğru okuduğunuzdan emin misiniz? Görebilmemiz için yükleyebilir misiniz?

Düzenleme Görsel muayene çoğu amaçlar için yeterli olması muhtemeldir olduğunu kabul ediyorum, böylece diğer taraftan, regresyon olmayan normale oldukça sağlamdır.


3
073/2575/25
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.