Monte Carlo simülasyonunun chisq.test()
R'deki fonksiyonda kullanımını anlamak istiyorum .
128 seviye / sınıfa sahip nitel bir değişkenim var. Örneklem boyutum 26 (daha fazla "birey" örnekleyemedim). Açıkçası, ben 0 "bireyler" ile bazı seviyeleri olacak. Ancak gerçek şu ki, mümkün olan 127 ders arasından sadece çok az sayıda sınıfım var. Ki-kare testi uygulamak için her seviyede en az 5 kişi olmamız gerektiğini duyduğumdan (bunun nedenini tam olarak anlamıyorum), simulate.p.value
dağılımı tahmin etmek için Monte Carlo simülasyonunu kullanma seçeneğini kullanmak zorunda olduğumu düşündüm ve bir p değeri hesaplayın. Monte Carlo simülasyonu olmadan, R bana bir p değeri verir < 1e-16
. Monte Carlo simülasyonu ile bana bir p değeri verir 4e-5
.
P değerini 26 ve 101 sıfırlık bir vektörle hesaplamaya çalıştım ve Monte-Carlo simülasyonu ile 1'de bir p değeri aldım.
Örneklem büyüklüğümün olası sınıfların sayısıyla karşılaştırıldığında küçük olsa bile, gözlemlenen dağılımın, tüm olası sınıfların gerçek popülasyonda aynı olasılıkta (1/127) var olması çok düşük bir olasılık olduğunu söylemek doğru mudur? ?