Çıkarım için lojistik modeller için, öncelikle burada hata olmadığını vurgulamak önemlidir. warning
Ar doğru maksimum olabilirlik tahmincisi parametre uzayın sınırına yatıyor belirtmek içindir. oran oranı , bir dernek için kuvvetli bir öneridir. Tek sorun, test üretmek için iki genel yöntemdir: Wald testi ve Olabilirlik oranı testi, alternatif hipotez altındaki bilgilerin değerlendirilmesini gerektirir.∞
Satırları boyunca oluşturulan verilerle
x <- seq(-3, 3, by=0.1)
y <- x > 0
summary(glm(y ~ x, family=binomial))
Uyarı yapılır:
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
Açıkçası bu verilere yerleşik olan bağımlılığı yansıtmaktadır.
R ise Wald testi ile bulunur summary.glm
veya waldtest
içinde lmtest
paket. Olabilirlik oran testi paket içinde anova
veya ile gerçekleştirilir . Her iki durumda da, bilgi matrisi sonsuz bir şekilde değerlendirilir ve sonuç yoktur. Aksine, R gelmez çıktı üretmek, fakat onu güven olmaz. R'nin tipik olarak bu durumlarda ürettiği çıkarım, bire çok yakın p-değerlerine sahiptir. Bunun nedeni, OR'da hassasiyet kaybının, varyans-kovaryans matrisindeki hassasiyet kaybından daha küçük büyüklük dereceleri olmasıdır.lrtest
lmtest
Burada özetlenen bazı çözümler:
Tek adımlı bir tahmin cihazı kullanın,
Tek adımlı tahmin edicilerin düşük önyargı, verimlilik ve genelleştirilebilirliğini destekleyen birçok teori vardır. R'de tek adımlı bir tahminci belirtmek kolaydır ve sonuçlar tahmin ve çıkarım için genellikle çok uygundur. Ve bu model asla ayrılmaz, çünkü yineleyici (Newton-Raphson) böyle yapma şansına sahip değil!
fit.1s <- glm(y ~ x, family=binomial, control=glm.control(maxit=1))
summary(fit.1s)
verir:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.03987 0.29569 -0.135 0.893
x 1.19604 0.16794 7.122 1.07e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Böylece tahminlerin trendin yönünü yansıttığını görebilirsiniz. Ve çıkarım, doğru olduğuna inandığımız eğilimlerin son derece anlamlı olduğunu gösteriyor.
puan testi yapmak,
Skor (veya Rao) istatistik olasılık oranı farklıdır ve istatistikleri Wald. Alternatif hipotez altında varyansın değerlendirilmesini gerektirmez. Modele boş değerin altına sığdık:
mm <- model.matrix( ~ x)
fit0 <- glm(y ~ 1, family=binomial)
pred0 <- predict(fit0, type='response')
inf.null <- t(mm) %*% diag(binomial()$variance(mu=pred0)) %*% mm
sc.null <- t(mm) %*% c(y - pred0)
score.stat <- t(sc.null) %*% solve(inf.null) %*% sc.null ## compare to chisq
pchisq(score.stat, 1, lower.tail=F)
Birleşme ölçüsü olarak çok güçlü istatistiksel önem verir. Bir adım tahmincisinin 50.7'lik bir test istatistiği ürettiğini ve buradaki puan testinin 45.75 pf test istatistiklerini ürettiğini unutmayın.χ2
> pchisq(scstat, df=1, lower.tail=F)
[,1]
[1,] 1.343494e-11
Her iki durumda da, bir VEYA sonsuzluğa dair çıkarımınız var.
ve bir güven aralığı için medyan yansız tahminleri kullanın.
Ortanca yansız kestirimi kullanarak, sonsuz oran oranı için medyan yansız, tekil olmayan% 95 CI üretebilirsiniz. epitools
R'deki paket bunu yapabilir. Ve bu tahmin ediciyi burada uygulamanın bir örneğini vereceğim: Bernoulli örneklemesi için güven aralığı