GLM çıkışındaki dağılım parametresi


11

R'de bir glm koştum ve summary()çıktının altına yakın bir yerde

(Dispersion parameter for gaussian family taken to be 28.35031)

Google'da bazı rummaging yaptım ve dispersiyon parametresinin standart hatalara uyacak şekilde kullanıldığını öğrendim. Birisinin dağılım parametresinin ne olduğu ve nasıl yorumlanması gerektiği hakkında daha fazla ayrıntı sağlayabileceğini umuyorum.

Yanıtlar:


9

Bunu keşfetmenin bir yolu, aynı modeli farklı araçlar kullanarak takmayı denemektir, işte bir örnek:

> fit1 <- lm( Sepal.Length ~ ., data=iris )
> fit2 <- glm( Sepal.Length ~ ., data=iris )
> summary(fit1)

Call:
lm(formula = Sepal.Length ~ ., data = iris)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.79424 -0.21874  0.00899  0.20255  0.73103 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)        2.17127    0.27979   7.760 1.43e-12 ***
Sepal.Width        0.49589    0.08607   5.761 4.87e-08 ***
Petal.Length       0.82924    0.06853  12.101  < 2e-16 ***
Petal.Width       -0.31516    0.15120  -2.084  0.03889 *  
Speciesversicolor -0.72356    0.24017  -3.013  0.00306 ** 
Speciesvirginica  -1.02350    0.33373  -3.067  0.00258 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.3068 on 144 degrees of freedom
Multiple R-squared: 0.8673,     Adjusted R-squared: 0.8627 
F-statistic: 188.3 on 5 and 144 DF,  p-value: < 2.2e-16 

> summary(fit2)

Call:
glm(formula = Sepal.Length ~ ., data = iris)

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-0.79424  -0.21874   0.00899   0.20255   0.73103  

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)        2.17127    0.27979   7.760 1.43e-12 ***
Sepal.Width        0.49589    0.08607   5.761 4.87e-08 ***
Petal.Length       0.82924    0.06853  12.101  < 2e-16 ***
Petal.Width       -0.31516    0.15120  -2.084  0.03889 *  
Speciesversicolor -0.72356    0.24017  -3.013  0.00306 ** 
Speciesvirginica  -1.02350    0.33373  -3.067  0.00258 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for gaussian family taken to be 0.09414226)

    Null deviance: 102.168  on 149  degrees of freedom
Residual deviance:  13.556  on 144  degrees of freedom
AIC: 79.116

Number of Fisher Scoring iterations: 2

> sqrt( 0.09414226 )
[1] 0.3068261

Dolayısıyla, doğrusal modelin artık standart hatasının glm'den dağılımın sadece kare kökü olduğunu, başka bir deyişle dağılımın (Gauss modelleri için) ortalama kare hatasıyla aynı olduğunu görebilirsiniz.


4

Y1,Y2,,YnR

Verilerinizi modellemek için normal dağıtım kullanıyorsanız, büyük olasılıkla

YiN(μ,σ2)

μσ

Ancak verilerinizin sayım verileri olduğunu ve dolayısıyla normal olarak dağıtılmadığını varsayalım. Bu durumda bile sürekli değil, bu nedenle Poisson dağılımını kullanabilirsiniz:

YiPoisson(λ)

λE[Yi]=λVar[Yi]=λ

Böylece insanlar ortalama ve varyansı aynı anda modellemede ek serbestlik derecesi elde etmek için dağılım parametresi ekler. Sanırım GLM ile ilgili herhangi bir ders kitabı size bunun ne olduğu hakkında daha ayrıntılı ve matematiksel bir açıklama verecek, ama inanıyorum ki motivasyon bu kadar basit.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.