Balıkçı testini daha iyi anlamak istedim, bu yüzden f ve m erkek ve kadına karşılık gelen ve n ve y "soda tüketimine" karşılık gelen aşağıdaki oyuncak örneğini tasarladım:
> soda_gender
f m
n 0 5
y 5 0
Açıkçası, bu büyük bir basitleştirme, ama bağlamın önüne geçmesini istemedim. Burada sadece erkeklerin soda içmediğini ve kadınların soda içtiğini ve istatistiksel prosedürlerin aynı sonuca ulaşıp ulaşmadığını görmek istedim.
Balıkçı tam testini R'de çalıştırdığımda, aşağıdaki sonuçları elde ederim:
> fisher.test(soda_gender)
Fisher's Exact Test for Count Data
data: soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0000000 0.4353226
sample estimates:
odds ratio
0
Burada, p değeri 0.007937 olduğu için, cinsiyet ve soda tüketiminin ilişkili olduğu sonucuna varacağız.
Balıkçı testinin hipergeomterik dağılımla ilişkili olduğunu biliyorum. Ben de bunu kullanarak benzer sonuçlar elde etmek istedim. Başka bir deyişle, bu sorunları aşağıdaki gibi görüntüleyebilirsiniz: 5 top "erkek" olarak etiketlenir ve 5 "kadın" olarak etiketlenir ve değiştirilmeden rastgele 5 top çizersiniz ve 0 erkek top görürsünüz. . Bu gözlemin şansı nedir? Bu soruyu cevaplamak için aşağıdaki komutu kullandım:
> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254
Sorularım: 1) İki sonuç nasıl farklı? 2) Yukarıdaki muhakememde yanlış veya titiz bir şey var mı?