“Tersine çevrilmiş” Shapiro – Wilk


11

Wikipedia'ya göre Sharipo-Wilk testi null hipotezini test eder ( ) "Popülasyon normal olarak dağıtılır".'H0

Ben benzer bir normallik testi için arıyorum "nüfus değil normal dağılımlı".'H0

Böyle bir test sahip, ben önem düzeyinde iff reddetmek için bir değeri hesaplamak istiyorum ; popülasyonumun normal olarak dağıldığını kanıtlıyorum.p'H0αp<α

Lütfen not Sharipo-Wilk testi kullanılarak ve kabul olduğunu IFF bir olan yanlış yaklaşımı bu anlamıyla "Biz H0 tutmadığı kanıtlamak için yeterli kanıt var" anlamına beri.'H0p>α

İlgili konu - ait anlam -değerip , normallik yararsız test ediyor? , ama sorunuma bir çözüm göremiyorum.

Sorular: Hangi testi kullanmalıyım? R'de uygulandı mı?


6
"Normal olarak dağıtılmamış" değerinin sıfır hipotezi kullanılamaz. Bu alan keyfi olarak normal dağılımlara yakın olan fakat tam olmayan dağıtımları içerecektir. Bana sonlu veri kümesi veriyorsunuz. Normal olmayan ve bu nedenle sıfır boşluğa ait olan ampirik dağılımı seçiyorum. Reddedilemez.
A. Webb

5
Önceki sorunuzla aynı olan bu soru imkansızı ister. Doğru bir cevap istatistiksel hipotez testlerinin nasıl çalıştığını açıklayacaktır, bu yüzden diğer sorunuza bir yorumda sizi stats.stackexchange.com/questions/31 adresine yönlendirdim .
whuber

5
"Normal olarak dağıtılmayan" bir sıfır hipotezi imkansız olsa da, bir sıfırlama hipotezi " bir eşdeğerlik testi çizgileri boyunca en azından " " kadar farklı olan normal uyum iyiliği istatistiğinin mutlak değerleri ile dağıtılır . Başka bir deyişle, bir sıfırın "en azından bu kadar normal olmayan" karşısında test yapabilmesi gerekir . @gung cevabında tam olarak bunu önerdi. ε
Alexis

Yanıtlar:


10

Veri bir testte diye bir şey yoktur edilir normalde dağıttı. Veri olduğunu sadece testler vardır değil normalde dağıttı. Böylece, Shapiro-Wilk gibi testler vardır, burada (diğerleri vardır), ancak boş değerin popülasyonun normal olmadığı ve alternatif hipotez popülasyonun normal olduğu konusunda hiçbir test yoktur. 'H0:nÖrmbirl

Tek yapabileceğiniz, umursadığınız normallikten ne tür bir sapma olduğunuzu (örneğin, çarpıklık) ve bu sapmanın sizi rahatsız etmeden önce ne kadar büyük olması gerektiğini bulmaktır. Ardından, verilerinizdeki mükemmel normallikten sapmanın kritik miktardan daha az olup olmadığını test edebilirsiniz. Genel fikir hakkında daha fazla bilgi için cevabımı burada okumak yardımcı olabilir: İstatistikçiler null hipotezi kabul etmek yerine neden anlamlı olmayan bir sonucun “sıfırı reddedemezsiniz” anlamına geldiğini söylüyor?


5

H0 önem düzeyi α iff p <α'da reddetmek için bir p değeri hesaplamak istiyorum; popülasyonumun normal olarak dağıldığını kanıtlamak

Normal dağılım, veriler bir dizi ilave iid olayı tarafından üretildiğinde ortaya çıkar (aşağıdaki quincunx görüntüsüne bakın). Bu, geri bildirim ve korelasyon olmadığı anlamına gelir, bu verilerinizi yönlendiren sürece benziyor mu? Değilse, muhtemelen normal değildir.

Sizin durumunuzda böyle bir işlemin meydana gelme ihtimali vardır. "Kanıtlamak" için gelebilecek en yakın insanların gelip (muhtemelen pratik değil) diğer dağıtımları göz ardı etmek için yeterli veri toplamaktır. Başka bir yol, diğer tahminlerle birlikte bazı teorilerden normal dağılımı çıkarmaktır. Veriler hepsiyle tutarlıysa ve kimse başka bir açıklama düşünemezse, bu normal dağılım lehine iyi bir kanıt olacaktır.

https://upload.wikimedia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.png https://en.wikipedia.org/wiki/Bean_machine

Eğer herhangi bir spesifik dağıtımın a priori olmasını beklemiyorsanız, verileri özetlemek için normal dağılımı kullanmak makul olabilir, ancak bunun aslında cehalet dışında bir seçim olduğunu kabul edin ( https://en.wikipedia.org/wiki/ Maksimum_entropinin prensibi ). Bu durumda, popülasyonun normal olarak dağıtılıp dağıtılmadığını bilmek istemezsiniz, bunun yerine normal dağılımın bir sonraki adımınız ne olursa olsun makul bir yaklaşım olup olmadığını bilmek istersiniz.

Bu durumda, verilerinizi (veya benzer olan oluşturulan verileri) ve onunla ne yapmayı planladığınızın bir açıklamasını sağlamanız gerekir, ardından "Bu durumda normallik varsayımı hangi yollarla beni yanlış yönlendirebilir?"


Aslında verilerin normal olduğunu biliyorum (bağımsız bilgisayarlarda bağımsız ölçüm), ancak tezim için bir miktar varsayım yapmalıyım .. açıklama ve örnek için teşekkür ederim :)
petrbel

1
Bu arada, Krieger Galton Quincunx'in Krieger, N. (2012) ' de kullanımlarına dair güzel bir eleştiri sağlamıştır . Kim ve “nüfus” nedir? tarihsel tartışmalar, güncel tartışmalar ve “nüfus sağlığını” anlama ve sağlık eşitsizliklerini düzeltme üzerindeki etkileri. Üç Aylık Milbank , 90 (4): 634-681.
Alexis

@petrbel Bu durum yukarıda tarif edilenden çok farklıdır. Her bir gözlemin bulunduğu ancak verileri üreten sürecin olmadığı bir quincunx tasarlayabilirsiniz. Log-normal bir örnek için buraya bakınız: LIMPERT ve ark. Bilimler Arası Log-Normal Dağılımlar: Anahtarlar ve İpuçları. Mayıs 2001 / Cilt. 51 No. 5. BioScience.
Livid

1
@Alexis Görüyorum ki Krieger (2012) Limpert ve ark. (2001) ve petrbel'in kaçırdığı noktayı belirtmektedir: "yapıyı değiştirmek, özdeş nesneler için bile sonuç olasılıklarını değiştirebilir, böylece farklı nüfus dağılımları yaratabilir".
Livid

2

Verilerinizde bir Normallik varsayımını asla "kanıtlayamazsınız". Sadece bir varsayım olarak aleyhinize delil sunun. Shapiro-Wilk testi bunu yapmanın bir yoludur ve her zaman Normallik varsayımını haklı çıkarmak için kullanılır. Bunun nedeni, Normallik olduğunu varsayarak başlamanızdır. Sonra soruyorsunuz, verilerim aptalca bir varsayımda bulunduğumu gösteriyor mu? Böylece Shapiro-Wilk ile test edersiniz. Eğer sıfır hipotezini reddedemezseniz, veriler saçma bir varsayım yaptığınızı göstermez.

Y,X


Sizin anlattığınız bu uygulama, petrbel'in bahsettiği yanlış yaklaşımdır. Testler genellikle tutarlıdır, bu nedenle numune boyutu büyüdükçe, normallik varsayımını aptalca bir fikir beyan etme olasılığı da artar. Bunun kendisi aptalca, çünkü daha büyük numune boyutlarında, çoğu prosedürün asimtotik sağlamlığı nedeniyle normallik varsayımı daha az kritiktir.
Horst Grünbusch

@ HorstGrünbusch Shapiro-Wilk testinin, verilerin Normal olduğu varsayımını test etmenin geçerli bir yolu olduğunu kabul etmiyor musunuz?
40'te TrynnaDoStat

Bunun geçerli bir yaklaşım olduğunu kabul ediyorsanız, cevabımda neye katılmadığınızdan emin değilim.
TrynnaDoStat

2α

@ HorstGrünbusch Cevabımla ilgili sorunun genel olarak hipotez testi fikri ile ilgili olduğu anlaşılıyor. Spesifik olarak, birçok durumda hipotez testlerinin örnek büyüklüğü sonsuza yaklaştıkça null olasılığını 1 reddedeceği gerçeği.
32'de TrynnaDoStat
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.