Lojistik regresyon kullanarak birinin ayarlanmış bir oran oranını nasıl tahmin ettiğine benzer şekilde ayarlanmış bir risk oranını tahmin etmekle ilgileniyorum. Bazı literatür (ör. Bu ), Huber-White standart hatalarıyla Poisson regresyonunun kullanılmasının bunu yapmak için model tabanlı bir yol olduğunu göstermektedir
Sürekli ortak değişkenler için ayarlamanın bunu nasıl etkilediğine dair literatür bulamadım. Aşağıdaki basit simülasyon, bu sorunun çok basit olmadığını göstermektedir:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
Bu durumda, gerçek risk oranı 2'dir ve bu, değişken değişken küçük olduğunda güvenilir bir şekilde geri kazanılır. Ancak, ortak değişken etkisi büyük olduğunda, bu bozulmaya başlar. Bunun var olduğunu varsayıyorum çünkü ortak değişken üst sınıra (1) karşı itebilir ve bu tahminin kontamine olmasını sağlar.
Düzeltilmiş risk oranı tahmininde sürekli ortak değişkenler için ayarlama hakkında herhangi bir literatür araştırdım ancak bulamadım. Bu sitede aşağıdaki yayınların farkındayım:
- İkili sonuçlara ilişkin göreceli riski tahmin etmek için Poisson regresyonu
- İkili veriler için Poisson regresyonu
ama soruma cevap vermiyorlar. Bu konuda herhangi bir makale var mı? Uygulanması gereken bilinen herhangi bir uyarı var mı?