Oran Oranlarının Standart Hatası nasıl hesaplanır?


10

Genom çapında ilişki çalışmalarından iki veri setim var. Mevcut tek bilgi ilk veri seti için olasılık oranı ve p değeridir. İkinci veri seti için, Oran Oranı, p değeri ve alel frekansları (AFD = hastalık, AFC = kontroller) var (örn: 0.321). Bu verilerin bir meta-analiz yapmaya çalışıyorum ama bunu gerçekleştirmek için etki boyutu parametresi yok. Sadece sağlanan bilgileri kullanarak bu verilerin her biri için SE ve OR güven aralıklarını hesaplamak için bir olasılık var mı?
Şimdiden teşekkür ederim

örnek: Mevcut veriler:

    Study     SNP ID      P        OR    Allele   AFD    AFC
    1         rs12345    0.023    0.85
    2         rs12345    0.014    0.91     C      0.32   0.25

Bu verilerle SE ve CI95% VEYA hesaplayabilir miyim? Teşekkürler

Yanıtlar:


16

Standart hataları p-değerleri üzerinden hesaplayabilir / yaklaşık olarak hesaplayabilirsiniz. İlk olarak, iki taraflı p değerlerini 2'ye bölerek tek taraflı p değerlerine dönüştürün.p=0,0115 ve p=0,007. Sonra bu p-değerlerini karşılık gelen z-değerlerine dönüştürün. İçinp=0,0115, bu z=-2,273 ve için p=0,007, bu z=-2,457(oranlar 1'in altında olduğu için negatiftirler). Bu z-değerleri aslında olasılık oranlarının günlüğünün karşılık gelen standart hatalara bölünmesiyle (yani,z=lÖg(ÖR,)/SE). Böylece,SE=lÖg(ÖR,)/z, bu da SE=0.071 ilk ve SE=0,038 ikinci çalışma için.

Şimdi bir meta-analiz yapmak için her şeye sahipsiniz. Metafor paketini kullanarak R ile hesaplamaları nasıl yapabileceğinizi göstereceğim:

library(metafor)
yi  <- log(c(.85, .91))     ### the log odds ratios
sei <- c(0.071, .038)       ### the corresponding standard errors
res <- rma(yi=yi, sei=sei)  ### fit a random-effects model to these data
res

Random-Effects Model (k = 2; tau^2 estimator: REML)

tau^2 (estimate of total amount of heterogeneity): 0 (SE = 0.0046)
tau (sqrt of the estimate of total heterogeneity): 0
I^2 (% of total variability due to heterogeneity): 0.00%
H^2 (total variability / within-study variance):   1.00

Test for Heterogeneity: 
Q(df = 1) = 0.7174, p-val = 0.3970

Model Results:

estimate       se     zval     pval    ci.lb    ci.ub          
 -0.1095   0.0335  -3.2683   0.0011  -0.1752  -0.0438       ** 

Meta-analizin log olasılık oranları kullanılarak yapıldığını unutmayın. Yani,-0,1095bu iki çalışmaya dayanan tahmini havuzlanmış log olasılık oranıdır. Bunu tekrar oran oranına dönüştürelim:

predict(res, transf=exp, digits=2)

 pred  se ci.lb ci.ub cr.lb cr.ub
 0.90  NA  0.84  0.96  0.84  0.96

Böylece, havuzlanmış oran oranı% 95 CI ile .90'dır: .84 ila .96.


Bana öyle geliyor ki ilk paragrafta hesaplanan SE değerleri, oran oranının standart hataları değil, oran oranının logaritmasının standart hataları olmalıdır.
Harvey Motulsky

Doğru. Oran oranlarına değil, günlük oran oranlarına SE'ye ihtiyacımız var. Meta-analiz log olasılık oranları kullanılarak yapılır, çünkü bunlar 0 civarında simetriktir (1 civarında simetrik olmayan oran oranlarının aksine) ve dağılımı normalliğe çok daha yakındır.
Wolfgang

@ Wolfgang, cevabınız için çok teşekkür ederim, aslında tarif ettiğim şeyi kullanıyorum, işimde, bu yüzden bazı referanslara ihtiyacım var ... formüller için bir alıntı ile bana yardımcı olabilir misiniz ?? şimdiden teşekkür ederim
Bernabé Bustos Becerra

Bütün bunlar "ilk ilkelere" dayanıyor, bu yüzden uygun bir referansın ne olacağından emin değilim. Örneğin, Araştırma Sentezi ve Meta-Analiz El Kitabı (Link) .
Wolfgang

2
Aslında, kılavuz yanlıştır ( pngu.mgh.harvard.edu/~purcell/plink/metaanal.shtml ). İlk örneğe bakın. SNP rs915677 için,ÖR,=0,7949 ve SE=0,5862. Bu standart hata log olasılık oranı içindir. CI tarafından verilirtecrübe(günlük(ÖR,)±1.96SE). Bu durumda:tecrübe(günlük(0,7949)±1.96x0,5862)=(0.252,2,508), aynen çıktıda gösterildiği gibi.
Wolfgang
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.