OLS ve Poisson GLM ile kimlik bağlantısı


11

Benim sorum Poisson regresyonunu ve genel olarak GLM'leri iyi anlamadığımı ortaya koyuyor. Sorumu açıklamak için bazı sahte veriler:

### some fake data
x=c(1:14)
y=c(0,  1,  2,  3,  1,  4,  9, 18, 23, 31, 20, 25, 37, 45)

Psuedo-R2'yi döndürmek için bazı özel işlevler:

### functions of pseudo-R2

psuR2 <- function(null.dev, model.dev) { 1 - (model.dev / null.dev)}

predR2 <- function(actuals, predicted) { 1 - (sum((actuals - predicted)^2)) / sum((actuals - mean(actuals))^2)}

Dört modele uyun: OLS, kimlik bağlantılı Gauss GLM, günlük bağlantılı Poisson GLM, kimlik bağlantılı Poisson GLM

#### OLS MODEL
mdl.ols=lm(y~x)
summary(mdl.ols)
pred.ols = predict(mdl.ols)

summary(mdl.ols)$r.squared
predR2(y, pred.ols)

#### GLM MODEL, family=gaussian(link="identity")
mdl.guass <- glm(y~x, family=gaussian(link="identity"), maxit=500)
summary(mdl.guass)
pred.guass = predict(mdl.guass)

psuR2(mdl.guass$null.deviance, mdl.guass$deviance)
predR2(y, pred.guass)

#### GLM MODEL, family=possion (canonical link)
mdl.poi_log <- glm(y~x, family=poisson(link="log"), maxit=500)
summary(mdl.poi_log)
pred.poi_log= exp(predict(mdl.poi_log))  #transform

psuR2(mdl.poi_log$null.deviance, mdl.poi_log$deviance)
predR2(y, pred.poi_log)

#### GLM MODEL, family=poisson((link="identity")
mdl.poi_id <- glm(y~x, family=poisson(link="identity"), start=c(0.5,0.5), maxit=500)
summary(mdl.poi_id)
pred.poi_id = predict(mdl.poi_id)

psuR2(mdl.poi_id$null.deviance, mdl.poi_id$deviance)
predR2(y, pred.poi_id)

Son olarak tahminleri çizin:

#### Plot the Fit
plot(x, y) 
lines(x, pred.ols)
lines(x, pred.guass, col="green")
lines(x,pred.poi_log, col="red")
lines(x,pred.poi_id, col="blue")

2 sorum var:

  1. OLS ve Gaussian GLM'den kimlik bağlantılı çıkan katsayılar ve tahminler tamamen aynı görünüyor. Bu her zaman doğru mu?

  2. OLS tahminlerinin ve tahminlerinin kimlik bağlantılı Poisson GLM'den çok farklı olduğuna çok şaşırdım . Her iki yöntemin de E (Y | X) tahmin etmeye çalışacağını düşündüm. Poisson için kimlik bağlantısını kullandığımda olasılık işlevi neye benziyor?



1
Poisson modeline kimlik bağlantısı ile yaklaşık olarak en az kareler yapmak isterseniz, kütüğün olduğu yerde ağırlıklı bir en küçük kareler modeli de ekleyebilirsiniz. böyle modellerin tahminleri kimlik bağlantısını ... çok yakın Poisson GLM o olacaktır - (y + 1,00000000001) daha sonra varyans (sqrt (y + 1E-10)) da çalışır bir ilk tahmin olarak alınır
Tom Wenseleers

Yanıtlar:


14
  1. Evet, aynı şey. Bir Gauss için MLE en küçük karelerdir, bu yüzden kimlik bağlantılı bir Gauss GLM yaptığınızda OLS yapıyorsunuz.

  2. a) " Her iki yöntemin de E (Y | X) tahmin etmeye çalışacağını düşündüm "

    Gerçekten de öyle, ama şartlı beklentinin verilerin bir fonksiyonu olarak tahmin edilme şekli aynı değil. Dağılımı görmezden gelsek (ve dolayısıyla verinin olasılığa nasıl girdiğini) ve GLM'yi sadece ortalama ve varyans açısından düşünüyor olsak bile (sanki sadece ağırlıklı bir gerileme gibi), bir Poisson varyansı ortalama ile artar, yani gözlemlerdeki nispi ağırlıklar farklı olacaktır.

    b) " Poisson için kimlik bağlantısını kullandığımda olasılık işlevi neye benziyor? "

    L(β0,β1)=ieλiλiyi/yi!

    =exp(iλi+yilog(λi)log(yi!))λi=β0+β1xi

    =exp(i(β0+β1xi)+yilog(β0+β1xi)log(yi!))


4
Glen_b'in ikinci noktasında bir ayrıntı. Kendime söylediğim bir hikaye, oldukça açıklayıcı buldum, tahmin edilen koşullu ortalama, poisson modelinde büyüdükçe, modelin koşullu ortalamadan uzak veri değerlerine daha toleranslı hale gelmesidir . Bunu, koşullu ortalamanın ne olduğu tahmin edilse de eşit olarak toleranslı olan düz doğrusal modelle karşılaştırın.
Matthew Drury

@Glen_b, sizden söylediklerinizi açıklığa kavuşturabilir miyim: "bu nedenle veriler olasılığa nasıl girer". MLE kullanılarak takıldığında, model uyum olasılığının bir OLS ve POisson (link = kimlik) arasında farklı olduğunu mu söylüyorsunuz? Yani, OLS'yi MLE kullanarak takıyorsanız, normal dağılım için olabilirlik fonksiyonunu, ikinci durumda poisson dağılımından olabilirlik fonksiyonuna karşı uyum olasılığını hesaplamak için mi kullanıyorsunuz?
Alex

1
@Alex Sağ; OLS Gaussian'da ML ve Gaussian olasılığı Poisson olasılığı değil
Glen_b -Restate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.