GLM'deki parametrelerin ailesi ile nasıl yorumlanır?


21

Bir gamma dağılım bağımlı değişkeni olan bir GLM için parametre yorumlaması ile ilgili bir sorum var. Bu benim GLM için bir log-link ile döndüren şey:

Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)

Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Gamma family taken to be 0.1747557)

Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184

Parametreleri nasıl yorumlayabilirim? exp(coef())Modelimi hesaplarsam , müdahale için ~ 500 elde ederim. Şimdi, diğer tüm değişkenler sabit tutulursa beklenen gelir anlamına gelmediğine inanıyorum, değil mi? Ortalama ya da mean(age)~ 2000'de yattığından beri . Ayrıca, değişkenlerin katsayılarının yönünü ve değerini nasıl yorumlayacağına dair hiçbir fikrim yok.


6
Diğer tüm değişkenler tamamen sıfır olsaydı (yalnızca sabit değil) 500 , gerçekten de regresyonda olduğu gibi beklenen gelire yakın olurdu .
Glen_b -Reinstate Monica,

@Glen_b, katsayıların üssel olması durumunda, açıklayıcı değişkende bir değişiklik olduğunda, gelir üzerindeki çarpımcı etki olması durumunda, neden gelir gelmesi bekleniyor?
tatami,

Tartışılan durum bütün açıklayıcı değişkenlerin 0 olduğu koşullu ortalamadır.
Glen_b -Reinstate Monica

Yanıtlar:


25

Log bağlantılı Gamma GLM spesifikasyonu üstel regresyon ile aynıdır:

E[y|x,z]=exp(α+βx+γz)=y^

Bu, . Bu çok anlamlı bir değer değildir (değişkenlerinizi önceden ortalamanın sıfır olması için merkezlenmediyseniz).E[y|x=0,z=0]=exp(α)

Modelinizi yorumlamanın en az üç yolu var. Bir beklenen değer türevi almaktır verilen göre :yxx

E[y|x,z]x=exp(α+βx+γz)β=y^β

Bu miktar bağlıdır ve sen ortalamasında bu değerlendirmek ya, böylece / medyan / modal veya temsili değerler ve veya ortalama almak sizin numunenin üzerinde. Bunların her ikisine de marjinal etkiler denir. Bu türevler, sadece (yükseklik) gibi sürekli değişkenler için mantıklı ve içinde küçük bir değişikliğin bir katkı maddesi etkisi söylemek ile .xzxzy^βxy

Eğer ikiliyse (cinsiyet gibi), bunun yerine sonlu farkları hesaplamayı düşünebilirsiniz: x

E[y|z,x=1]-E[y|z,x=0]=exp(α+β+γz)-exp(α+γz)=exp(α+γz)(exp(β)-1)

Bu daha mantıklı, çünkü cinsiyette sonsuz bir değişiklik olduğunu düşünmek zor. Elbette, bunu sürekli bir değişkenle de yapabilirsiniz. Bunlar minik bir tane yerine birimindeki değişiklikten kaynaklanan ilave etkilerdir .x

Üçüncü yöntem, katsayıları yükseltmektir. Bunu not et:

E[y|z,x+1]=exp(α+β(x+1)+γz)=exp(α+βx+β+γz)=exp(α+βx+γz)exp(β)=E[y|z,x]exp(β)

Bu, üstelleştirilmiş katsayıları , ilave olarak değil, çarpımsal olarak yorumlayabileceğiniz anlamına gelir . 1 ile değiştiğinde size çarpanı beklenen değer üzerinde verir .x


1
İkinci yorumu açıklar mısın?
tatami

@tatami İkili durumda bir hata düzeltildi. Şimdi daha mantıklı mı?
Dimitriy V. Masterov

2

İlk önce modelin ne kadar iyi uyduğunu görmek için artıklara bakacağım. Tamamsa, gerçekten bir gama dağılımından geldiğine inanmak için bir nedenim olmadıkça, diğer bağlantı işlevlerini kullanmayı deneyebilirim. Eğer gama hala ikna edici görünüyorsa, istatistiksel olarak anlamlı terimlerin kesişme, yükseklik, eğitim, seks ve lise (üç yıldızla işaretli olanlar) olduğu sonucuna varırım. Kendileri arasında standartlaştırılmadıkça daha fazlası söylenemez (aynı aralığa sahip).

Yoruma cevap: Sorunuzu şimdi daha iyi anlıyorum. Bunu kesinlikle yapabilirsin! Yükseklikte bir birim artış, gelirde bir exp (0.0082530) -1 ~ = 0.0082530 (küçük x için exp x = 1 + x yaklaşımını kullanarak) gelirdeki nispi değişime neden olur. Yorumlaması çok kolay değil mi?


1
Bu yüzden parametreleri aslında yorumlayamıyorum, örneğin yükseklik bir artarsa, gelir xy artar?

1
Şimdi çarpımla yorumlamam gerektiğine inanıyorum: exp (Intercept) * exp (height), 1 birim yüksekliğinde bir gelirle gelir. Yine de teşekkürler! :)
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.