Formül ve R'nin fisher.test'inden oran oranları neden farklı? Hangisini seçmeli?


14

Aşağıdaki örnekte

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

Oran oranını (# 1) "manuel olarak", 0.600; sonra (# 2) Fisher kesin testinin çıktılarından biri olarak, 0.616.

Neden aynı değeri alamadım?

Neden oran oranını hesaplamanın birkaç yolu vardır ve en uygun olanı nasıl seçersiniz?

Yanıtlar:


10

İçin yardım sayfasından fisher.test():

Koşulsuz MLE (koşullu olasılık oranı) yerine koşullu Maksimum Olabilirlik Tahmini'nin (MLE) kullanıldığını unutmayın.


3

Buradaki tartışmaya eklemek için, bu "koşullu" olasılıkta tam olarak neyin koşullandırıldığını sormak faydalı olacaktır . Fisher testi, diğer kategorik analizlerden farklıdır , çünkü tablonun tüm marjları sabit olarak değerlendirilirken, lojistik regresyon modeli (ve lojistik modelin puan testi olan karşılık gelen Pearson ki-kare testi) sadece bir marjın düzeltildiğini düşünür .

Fisher testi daha sonra hipergeometrik dağılımı, 4 hücrenin her birinde gözlenen sayımlar için bir olasılık modeli olarak değerlendirir. Hipergeometrik dağılım, başlangıçtaki oran oranının dağılımı sürekli olmadığından, maksimum olasılık tahmini olarak genellikle farklı bir OR elde edeceğiniz özelliğine sahiptir.


2
Cevabınızın bu özel olasılığın nasıl ortaya çıkabileceğini netleştirdiğini sanmıyorum. Veri oluşturma sürecini bir ürün-binomiyal ile modelleyiyorsanız, diyelim ki, Wallenius'un merkezi olmayan hipergeometrik dağılımı ile marjinal toplamlara bağlı olarak farklı bir olasılık (& MLE) elde edersiniz - marjinal her iki durumda da toplamlar "sabit kabul edilir".
Scortchi - Monica'yı eski durumuna döndürün

1

İkinci sorunuza cevap vermek için, biostatlar benim zorum değil, ancak çoklu oran oranı istatistiklerinin nedeninin örnekleme tasarımı ve deney tasarımını hesaba katmak olduğuna inanıyorum.

Burada, koşullu MLE ile olasılık oranı için koşulsuz ve diğer türler arasında neden bir fark olduğu konusunda biraz bilgi verecek üç referans buldum.

  1. 2 × 2 tabloların sabit marjinallerle kombinasyonunda ortak oran oranının nokta ve aralık tahmini

  2. Çift Eşleşmeli ve Tabakalı Örnekler için Sapmanın Nispi Risk Tahmincileri Üzerine Etkisi

  3. Ortak Oran Oranının Koşullu Maksimum Olabilirlik Tahmininin Karşılaştırmalı Bir Çalışması


3
Bu referansların söylediklerini en azından biraz özetlemek yararlı olacaktır.
Scortchi - Monica'yı eski durumuna döndürün

@Scortchi, kabul etti. İşle meşguldüm ve sadece ilk veya iki sayfayı okuma şansım oldu. Bu hafta sonu her birinin bir özetini ekleyeceğim.
Jon

@Jon Yapabilirseniz, bu kısa özeti eklemek yararlı olacaktır
Glen_b -Restate Monica

@ Sadece bir soru sordum. Orijinal sorumu gönderdikten 4 yıl sonra ikinci bir soru ekleyen bli'ydi. İkinci soruya atıfta bulunduğunuzda bli'nin sinir bozucu düzenlemesini tersine çevirmiyorum, ancak bir cevabı nasıl kabul edeceğinizden emin değilim.
winerd
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.