Fisher'in kesin testini simüle edilmiş bir genetik problemde uygulamaya çalışıyorum, ancak p değerleri sağa eğik görünüyor. Bir biyolog olarak, sanırım her istatistikçi için açık bir şey eksik, bu yüzden yardımlarınız için çok minnettar olurum.
Benim kurulumum şu
şekildedir : (kurulum 1, marjinaller sabit değildir)
R'de 0 ve 1'lerden oluşan iki örnek rastgele üretilir. Her n = 500 örneği, 0 ve 1 örnekleme olasılıkları eşittir. Daha sonra her numunedeki 0/1 oranlarını Fisher kesin testi ile karşılaştırırım (sadece fisher.test
; benzer sonuçlara sahip diğer yazılımları da denedim). Örnekleme ve test 30.000 kez tekrarlanır. Ortaya çıkan p değerleri şu şekilde dağıtılır:
Tüm p-değerlerinin ortalaması 0.0577'de 0.55, 5. persentildir. Dağıtım bile sağ tarafta süreksiz görünür.
Yapabildiğim her şeyi okudum, ancak bu davranışın normal olduğuna dair herhangi bir gösterge bulamıyorum - öte yandan, sadece simüle edilmiş veriler, bu yüzden herhangi bir önyargı için kaynak görmüyorum. Kaçırdığım herhangi bir düzenleme var mı? Çok küçük numune boyutları? Ya da belki tekdüze olarak dağılmaması ve p-değerlerinin farklı yorumlanması gerekir mi?
Yoksa bunu sadece bir milyon kez tekrarlamalı mıyım, 0,05 kantili bulmalı mıyım ve bunu gerçek verilere uyguladığımda bunu anlamlılık olarak mı kullanmalıyım?
Teşekkürler!
Güncelleme:
Michael M, 0 ve 1'in marjinal değerlerini düzeltmeyi önerdi. Şimdi p-değerleri çok daha iyi bir dağılım veriyor - maalesef, tekdüze değil, tanıdığım başka bir şekle sahip:
gerçek R kodunu ekleyerek: (kurulum 2, marjinaller düzeltildi)
samples=c(rep(1,500),rep(2,500))
alleles=c(rep(0,500),rep(1,500))
p=NULL
for(i in 1:30000){
alleles=sample(alleles)
p[i]=fisher.test(samples,alleles)$p.value
}
hist(p,breaks=50,col="grey",xlab="p-values",main="")
Son düzenleme:
Whuber'ın yorumlarda belirttiği gibi, alanlar binning nedeniyle bozuk görünüyor. Kurulum 1 (serbest marjinaller) ve kurulum 2 (sabit marjinaller) için QQ grafiklerini ekliyorum. Glen'in aşağıdaki simülasyonlarında da benzer grafikler görülüyor ve tüm bu sonuçlar aslında oldukça homojen görünüyor. Yardım için teşekkürler!