7 gün boyunca bireylerin gerçekleştirdiği eylem sayısını içeren bir veri setim var. Özel eylem bu soru için geçerli olmamalıdır. Veri kümesi için bazı tanımlayıcı istatistikler:
Verilerin bir histogramı:
Verilerin kaynağından yola çıkarak, bunun bir Poisson dağılımına uyacağını düşündüm. Bununla birlikte, ortalama ian varyans ve histogram ağır sola ağırlıklandırılır. Ayrıca, goodfit
testi R'de çalıştırdım ve aldım:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
Maksimum Olabilirlik yöntemi de p-değeri = 0 verdi. Boş hipotez olduğu varsayıldığında: veriler bir Poisson dağılımıyla eşleşir (dokümantasyon bunu belirtmez), sonra goodfit
test boş hipotezi reddetmemiz gerektiğini söyler, bu nedenle veriler bir Poisson dağılımıyla eşleşir.
Bu analiz doğru mu? Eğer öyleyse, bu verilere hangi dağıtımın uygun olacağını düşünüyorsunuz?
Nihai hedefim, araçların farklı olup olmadığını görmek için 2 örnek arasındaki ortalama eylem sayısını karşılaştırmak; dağıtımın kontrol edilmesi bile gerekli mi? Anladığım kadarıyla tipik testler (z-, t-, testleri) Poisson dağılımları için işe yaramıyor. Veriler gerçekten Poisson dağıtılmışsa hangi testi kullanmalıyım?