abstract.glm () içindeki dağılım


13

Tarafından bir glm.nb yürüttüm

glm1<-glm.nb(x~factor(group))

grup bir kategorik ve x bir metrik değişken. Sonuçların özetini almaya çalıştığımda, summary()veya kullanmama bağlı olarak biraz farklı sonuçlar alıyorum summary.glm. summary(glm1)bana verir

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

Buna karşılık özet.glm (glm1) bana

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Dispersiyon parametresinin anlamını anlıyorum, ama çizginin değil

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067).

El kitabında, tahmini dağılım olacağını söylüyor, ancak 0.95 0.7109'a yakın olmadığından kötü bir tahmin gibi görünüyor veya tahmini dağılım, tahmini dağılım parametresinden farklı bir şey mi? Sanırım, dispersiyonu bir summary.nb(x, dispersion=)şeye ayarlamalıyım, ama emin değilim, eğer dispersiyonu 1'e ayarlamam gerekirse (bu summary()da dağılım parametresinin bir tahminini girmem gerekirse veya aynı sonucu verirse, Bu durumda yol açan summary.nb(glm1, dispersion=0.7109)başka falan? ya da sadece kullanarak iyiyim summary(glm1)?


3
Sınıf negbin için uygun S3 yöntemine gönderilirken özet () kullanın. Dağılım elbette 1 olmalıdır, tahmin edilen teta'dır, bu da karışıklığı önlemek için daha iyi bir şekil parametresi olarak adlandırılır. Ayrıca bkz. Stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…
Momo

Yanıtlar:


14

summary.glm"negbin"summary.glmdispersionsummary.glm glmϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmtakılan modelde glm.nb, kod içinde

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial"ϕsummary.negbin

ϕdispersion

İkincisi, çıktıyı yanlış anlıyorsunuz. Gördüğünde

Negative Binomial(0.7109)

θ^ϕ

ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

negbinϕ


5
+1 Güzel açıklama. İki küçük yorum var: Binom, Poisson ve negatif binomda bilinen şekil parametresi ile dağılım parametresi üstel ailenin tanımı ile 1'dir (bu bir varsayım değildir). Farklı bir dağılımın tahmin edilebileceğini ve özet yönteme verilebileceğini söylediğinizde, dikkatli olunmalıdır, çünkü biri özellikle olasılık için sonuçları olan yarı bölgeye girecektir.
Momo

@Momo İyi dedi. Belirttiğiniz şey ile ilgili işlevler için yardım sayfasının ayrıntıları arasında ayrıldım.
Monica'yı eski durumuna getirin - G. Simpson

2

θ1θ11θEYEμEμ

f(y)=Γ(θ+y)Γ(θ)y!μyθθ(μ+θ)θ+y

beklenti

EY=μ

& varyans

VarY=μ+μ2θ

@Momo'nun işaret ettiği gibi, dağılım parametresi tamamen başka bir şeydir, bu da yarı olabilirlik tahmini yapmanıza izin verir. Negatif binom modeli ve (gerçek) Poisson modeli için, haklı olarak bir değerine sabitlenmiştir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.