Ki-kare testi için p-değerlerinin Monte Carlo simülasyonunu uygulama kuralları


9

Monte Carlo simülasyonunun chisq.test()R'deki fonksiyonda kullanımını anlamak istiyorum .

128 seviye / sınıfa sahip nitel bir değişkenim var. Örneklem boyutum 26 (daha fazla "birey" örnekleyemedim). Açıkçası, ben 0 "bireyler" ile bazı seviyeleri olacak. Ancak gerçek şu ki, mümkün olan 127 ders arasından sadece çok az sayıda sınıfım var. Ki-kare testi uygulamak için her seviyede en az 5 kişi olmamız gerektiğini duyduğumdan (bunun nedenini tam olarak anlamıyorum), simulate.p.valuedağılımı tahmin etmek için Monte Carlo simülasyonunu kullanma seçeneğini kullanmak zorunda olduğumu düşündüm ve bir p değeri hesaplayın. Monte Carlo simülasyonu olmadan, R bana bir p değeri verir < 1e-16. Monte Carlo simülasyonu ile bana bir p değeri verir 4e-5.

P değerini 26 ve 101 sıfırlık bir vektörle hesaplamaya çalıştım ve Monte-Carlo simülasyonu ile 1'de bir p değeri aldım.

Örneklem büyüklüğümün olası sınıfların sayısıyla karşılaştırıldığında küçük olsa bile, gözlemlenen dağılımın, tüm olası sınıfların gerçek popülasyonda aynı olasılıkta (1/127) var olması çok düşük bir olasılık olduğunu söylemek doğru mudur? ?


3
Verileriniz gerçekten 26 örnekten 26 farklı sınıf gözlemlediyseniz, o zaman 127 sınıfın hepsinin eşit olasılığa sahip olduğu hipotezine karşı hiçbir kanıtınız yoktur. Bu, çok terimli bir dağıtım hesaplamasıyla değerlendirilebilir.
whuber

1
" Ki-kare testi uygulamak için duyduğum gibi her düzeyde en az 5 kişi olmalıdır (bunun sebebini tam olarak anlamıyorum) " - tam olarak değil. Orijinal tavsiye, gerçek sayımın değil , beklenen sayının en az 5 olması gerektiğiydi. Bu (şimdi çok eski) kuralın amacı, ki-kare dağılımının test istatistiği. Son yirmi yılda bir dizi makaleye ilişkin tavsiye 'bu kural biraz fazla katıdır'.
Glen_b -Monica'yı geri yükleAğustos

Yanıtlar:


6

Arayarak, Monte-Carlo Simülasyonunun amacı, test koşulları yerine getirilmediğinde p değerlerini hesaplamak için test edilen örnekle aynı boyuta sahip rastgele üretilen numunelere dayanan bir referans dağılımı üretmek gibi görünüyor.

Bu bulunabilir Umut A. J Kraliyet Stat Toplum Serisi B (1968) 'de açıklanmıştır JSTOR .

İşte Hope gazetesinden ilgili bir alıntı:

Monte-Carlo önem testi prosedürleri, gözlemlenen verilerin test edilen hipoteze göre oluşturulan rastgele örneklerle karşılaştırılmasını içerir. ... Alternatif istatistiksel hipotezin tamamen belirtilebileceği varsayılarak, Monte-Carlo test prosedürü yerine bilinen iyi bir verimlilik testinin kullanılması tercih edilir. Bununla birlikte, böyle bir testin kullanılması her zaman mümkün değildir, çünkü testi uygulamak için gerekli koşullar sağlanamayabilir veya temeldeki dağıtım bilinmeyebilir veya uygun bir test kriterine karar vermek zor olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.