Simetrik olduklarına inanılıyor çünkü oldukça sık normal bir yaklaşım kullanılıyor. Bu, p'nin 0,5 civarında olması durumunda yeterince çalışır. binom.test
diğer yandan, F dağılımına dayanan “kesin” Clopper-Pearson aralıklarını bildirir (her iki yaklaşımın tam formülleri için buraya bakın ). Eğer Clopper-Pearson aralığını R'de uygularsak, bunun gibi bir şey olurdu ( nota bakınız ):
Clopper.Pearson <- function(x, n, conf.level){
alpha <- (1 - conf.level) / 2
QF.l <- qf(1 - alpha, 2*n - 2*x + 2, 2*x)
QF.u <- qf(1 - alpha, 2*x + 2, 2*n - 2*x)
ll <- if (x == 0){
0
} else { x / ( x + (n-x+1)*QF.l ) }
uu <- if (x == 0){
0
} else { (x+1)*QF.u / ( n - x + (x+1)*QF.u ) }
return(c(ll, uu))
}
Hem linkte hem de uygulamada üst ve alt limit formülünün tamamen farklı olduğunu görüyorsunuz. Simetrik güven aralığının tek örneği p = 0.5 olduğunda. Bağlantıdaki formülleri kullanarak ve bu durumda kendini nasıl ortaya çıkardığını bulmak çok kolay.n=2×x
Kişisel olarak lojistik bir yaklaşıma dayanan güven aralıklarına bakmayı daha iyi anladım. Binom verileri genellikle şu şekilde tanımlanan bir logit link işlevi kullanılarak modellenir:
logit(x)=log(x1−x)
Bu link fonksiyonu lojistik regresyondaki hata terimini "normal dağılıma" eşler. " Sonuç olarak, lojistik çerçevedeki güven aralıkları, klasik doğrusal regresyon çerçevesindeki gibi, logit değerleri etrafında simetriktir. Logit dönüşümü, tam olarak normallik esaslı teorinin lineer regresyon çevresinde kullanılmasına izin vermek için kullanılır.
Ters dönüşümü yaptıktan sonra:
logit−1(x)=ex1+ex
Yine asimetrik bir aralık alıyorsunuz. Şimdi bu güven aralıkları aslında önyargılı. Onların kapsamı, özellikle binom dağılımının sınırları dahilinde beklediğiniz gibi değil. Yine de, bir örnek olarak, bir binom dağılımının asimetrik güven aralıklarına sahip olmasının neden mantıklı olduğunu gösteriyorlar.
R'deki bir örnek:
logit <- function(x){ log(x/(1-x)) }
inv.logit <- function(x){ exp(x)/(1+exp(x)) }
x <- c(0.2, 0.5, 0.8)
lx <- logit(x)
upper <- lx + 2
lower <- lx - 2
logxtab <- cbind(lx, upper, lower)
logxtab # the confidence intervals are symmetric by construction
xtab <- inv.logit(logxtab)
xtab # back transformation gives asymmetric confidence intervals
not : Aslında, R beta dağılımını kullanır, ancak bu tamamen eşdeğerdir ve hesaplama açısından biraz daha verimlidir. Bu nedenle R'deki uygulama burada gösterdiklerimden farklı, ancak tam olarak aynı sonucu veriyor.