Dağıtımım normal; Kolmogorov-Smirnov testi aynı fikirde değil


15

Bazı verilerin normalliği ile ilgili bir sorunum var: p = .0000 ile normal olmadığını söyleyen bir Kolmogorov testi yaptım, anlamıyorum: dağılımımın çarpıklığı = -. 497 ve basıklık = -0,024

İşte dağıtımımın çok normal görünen planı ...

(Üç puanım var ve bu puanların her biri Kolmogorov testi için önemli bir p değeri ile normal değil ... Gerçekten anlamıyorum)

resim açıklamasını buraya girin

resim açıklamasını buraya girin


11
Normal olduğunu nereden biliyorsun? Bana normal gelmiyor. Sola eğik görünüyor.
mark999

1
Neden normalliği test ediyorsunuz?
Jack Aidley

Yanıtlar:


39
  1. Verilerinizin normal olduğunu iddia etmek için bir dayanağınız yok. Senin çarpıklık ve fazla basıklık hem olsa bile tam olarak 0, o gelmez ima veri normaldir. Beklenen değerlerden uzak çarpıklık ve basıklık normallik olmadığını gösterirken, tersi de geçerli değildir. Normal ile aynı çarpıklığa ve basıklığa sahip normal olmayan dağılımlar vardır. Yoğunluğu aşağıda çoğaltılan bir örnek burada tartışılmıştır :
    dgam 2.3

    Gördüğünüz gibi, bu kesinlikle bimodal. Bu durumda, dağılım simetriktir, bu nedenle yeterli anlar olduğu sürece, tipik çarpıklık ölçüsü 0 olacaktır (aslında tüm olağan önlemler olacaktır). Basıklık için, ortalamanın yakınında bölgeden 4. anlara katkı, basıklığı küçültme eğiliminde olacaktır, ancak kuyruk nispeten ağırdır, bu da onu büyütme eğilimindedir. Doğru seçerseniz, basıklık normal ile aynı değerde ortaya çıkar.

  2. Örnek çarpıklığınız aslında -0,5 civarındadır, bu da hafif sol çarpıklığı düşündürür. Histogramınız ve QQ grafiğinizin ikisi de aynıdır - hafifçe sola eğriltme dağılımı. (Bu tür hafif çarpıklığın, yaygın normal teori prosedürlerinin çoğu için bir sorun olması muhtemel değildir.)

  3. Bir priori'yi kabul etmeyi beklememeniz gereken normallik dışı birkaç farklı göstergeye bakıyorsunuz , çünkü dağıtımın farklı yönlerini düşünüyorlar; ufacık, hafif normal olmayan numunelerle, çoğu zaman aynı fikirde olmazlar.


Şimdi büyük soru için: * Neden normalliği test ediyorsunuz ? *

[yorumlara yanıt olarak düzenlendi:]

Gerçekten emin değilim, ama bir ANOVA yapmadan önce yapmalıyım

Burada dikkat edilmesi gereken birkaç nokta var.

ben. Çıkarım için kullanıyorsanız hipotez bir ANOVA varsayımıdır (hipotez testi gibi), ancak daha büyük örneklerde normalliklere karşı özellikle hassas değildir - hafif normallik çok az sonuç verir ve numune boyutları dağılımı arttırabilir daha normal hale gelir ve test sadece biraz etkilenebilir.

ii. Yanıtın normalliğini (DV) test ediyor gibi görünüyorsunuz. DV'nin kendisinin (koşulsuz) dağılımının ANOVA'da normal olduğu varsayılmamaktadır. Koşullu dağılım hakkındaki varsayımın makul olup olmadığını değerlendirmek için kalıntıları kontrol edersiniz (yani, normal kabul edilen modeldeki hata terimi) - yani doğru şeye bakmıyorsunuz. Gerçekten de, artıklar üzerinde kontrol yapıldığı için, bunu model yerine taktıktan sonra, daha önce değil.

iii. Resmi testler işe yaramaz olabilir. Buradaki ilgi konusu, hipotez testinin gerçekten cevap vermediği 'normallik derecesinin çıkarımımı ne kadar kötü etkilediğidir'. Örnek boyutu büyüdükçe, test normallikten gelen önemsiz farklılıkları giderek daha fazla tespit edebilir hale gelirken, ANOVA'daki önem seviyesi üzerindeki etki küçülür ve küçülür. Yani, örneklem büyüklüğünüz oldukça büyükse, normallik testi çoğunlukla size büyük bir örneklem büyüklüğünüz olduğunu söyler, yani endişelenecek çok şeyiniz olmayabilir. En azından bir QQ grafiğiyle, bunun normal olmadığının görsel bir değerlendirmesine sahipsiniz .

iv. makul örnek büyüklüklerinde, diğer varsayımlar - varyans ve bağımsızlık eşitliği gibi - genellikle hafif normallikten çok daha önemlidir. İlk önce diğer varsayımlardan endişe edin ... ama yine de, resmi test doğru soruyu cevaplamıyor

v. bir hipotez testinin sonucuna dayanan bir ANOVA veya başka bir test yapıp yapmayacağınızı seçmek, varsayım geçerli değil gibi davranmaya karar vermekten daha kötü özelliklere sahip olma eğilimindedir. (Normallik varsaymanız için bir nedeniniz olmadığını düşündüğünüzde kullanabileceğiniz normal olduğu kabul edilmeyen veriler üzerinde tek yönlü ANOVA benzeri analizler için uygun çeşitli yöntemler vardır. Bazıları çok iyi güce sahiptir normal ve iyi bir yazılım ile onlardan kaçınmak için bir neden yoktur.)

[Bu son nokta için bir referansım olduğuna inanıyorum ama şu anda bulamıyorum; onu bulursam geri gelip koymaya çalışacağım]


Histogramınızı kabaca min 12 mod 48 max 60 gösterdiği için okudum, bu yüzden min - mod 36, mod - max 12'dir.
Nick Cox

10

Kolmogorov-Smirnov Testi, örnek boyutları büyük olduğunda adil bir güce sahiptir, bu nedenle verilerinizin normallikten farklı olmadığı yönündeki sıfır hipotezini reddetmek kolay olabilir. Başka bir deyişle, test bazen çoğu örnek için normal olsa bile büyük numunelerde dağılımın normal olmadığını önerecektir.

Bunu bir t-testi gibi düşün. Yüksekliği bir milimetrenin binde biri kadar farklı olan iki popülasyonunuz varsa, inanılmaz derecede büyük örnekler, fark anlamsız olsa bile, bunların farklı olduğunu istatistiksel olarak destekleyecektir.

Belki de verilerinizin normalliğini belirlemek için diğer yöntemlere güvenebilirsiniz. Kullandığınız araziler, eğri / basıklık değerlerinin yanı sıra iki iyi örnektir.

Bu diğer konu özellikle ilgili görünüyor: Normallik testi 'esasen işe yaramaz mı?


Oh tamam, doğru dikişler, benim örnek boyutu oldukça büyük (n = 660), büyük örnek boyutu tarafından daha az önyargılı olan başka bir test var mı?
Boo


13
Testler büyük numune boyutuna göre önyargılı değildir.
Peter Flom - Monica'yı eski durumuna döndürün

10

Boş hipotez tam olarak belirtildiğinde Kolmogorov-Smirnov testi dağıtımdan bağımsızdır - verilerden ortalama ve varyans tahmin edilirse, normalliği test ederken (gerekirse) Lilliefors varyantını kullandığınızdan emin olun. Bu diğer cevapları kazanmak için değil.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.