Lojistik Regresyon: Doygun bir model nasıl elde edilir


17

Sadece lojistik gerilemenin sapma ölçüsünü okudum. Ancak, doymuş model adı verilen kısım benim için net değil.

Kapsamlı bir Google araması yaptım ancak sonuçların hiçbiri sorumu yanıtlamadı. Şimdiye kadar, doymuş bir modelin her gözlem için bir parametre olduğunu ve bunun sonucunda mükemmel bir uyumla sonuçlandığını öğrendim. Bu benim için açık. Ancak: ayrıca (doymuş bir modelin) takılmış değerleri gözlenen değerlere eşittir.

Bildiğim kadarıyla, lojistik regresyon sınıflandırma için kullanıldığından, gözlenen veriler ek etiketler . Ancak sapma ölçüsü olasılıkları kullanır ancak gerçek etiketleri kullanmaz. Bunlardan biri, lojistik regresyonun gözlenen olasılıklara karşı hesaplanan tahmini olasılığını uygular. Ancak, biri olasılıklar yerine sadece etiketler verdiğinden, bu etiketlerden doymuş bir modelin nasıl oluşturulacağı konusunda kafam karıştı?y{0,1}

Yanıtlar:


17

yiyi12log(1/1)=00

y = c(1,1,1,0,0,0)
a <- factor(1:length(y)) 
fit <- glm(y~a,family=binomial) 
summary(fit)

Deviance Residuals: 
 0  0  0  0  0  0

Null deviance: 8.3178e+00  on 5  degrees of freedom

Residual deviance: 2.5720e-10  on 0  degrees of freedom

nn(n1)

> k2
 [1] 1 2 3 4 5 6 1 2 3 4 5 6
Levels: 1 2 3 4 5 6
> y2
 [1] 1 1 1 0 0 0 1 1 1 0 0 0
> fit3 = glm(y2 ~ k2, family = binomial)
> summary(fit3)    

    Null deviance: 1.6636e+01  on 11  degrees of freedom
    Residual deviance: 5.1440e-10  on  6  degrees of freedom

Aslında, R'de doymuş modelin ne olduğu, veriler tamamen aynı olsa bile giriş biçimine bağlı olduğu ortaya çıkıyor, ki bu çok hoş değil. Özellikle, yukarıdaki örnekte 12 gözlem ve 6 faktör seviyesi vardır, bu nedenle doymuş modelin 12 değil, 6 parametreye sahip olması gerekir. Genel olarak, doymuş bir model, parametre sayısının değerine eşit olduğu bir model olarak tanımlanır. farklı ortak değişkenler. R kodu neden bu faktör k2 6 farklı düzeyleri vardır "kabul" hiçbir fikrim yok ve yine de doymuş model 12 parametre ile donatılmış.

Şimdi, aynı verileri "binom" biçiminde kullanırsak, doğru bir cevap alırız:

y_yes = 2 * c(1,1,1,0,0,0)
y_no = 2 * c(0,0,0,1,1,1)
x = factor(c(1:6))

> x
[1] 1 2 3 4 5 6
Levels: 1 2 3 4 5 6
> y_yes
[1] 2 2 2 0 0 0
> y_no
[1] 0 0 0 2 2 2

modelBinomialForm = glm(cbind(y_yes, y_no) ~ x, family=binomial)

Deviance Residuals: 
[1]  0  0  0  0  0  0

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)  2.490e+01  1.096e+05       0        1
x2           1.375e-08  1.550e+05       0        1
x3           1.355e-08  1.550e+05       0        1
x4          -4.980e+01  1.550e+05       0        1
x5          -4.980e+01  1.550e+05       0        1
x6          -4.980e+01  1.550e+05       0        1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1.6636e+01  on 5  degrees of freedom
Residual deviance: 3.6749e-10  on 0  degrees of freedom

Şimdi doymuş modelin 6 parametreye sahip olduğunu ve uygun modele denk geldiğini görüyoruz. Bu nedenle, boş sapma (6 - 1) = 5 df ve artık sapma (6-6) = 0 df'dir.


Emin misiniz? Eğeryben oldu 0 sapma ifadesindeki payda olur 0ayrıca tanımlanmamıştır.
toom
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.