Poisson regresyonu vs. log-count en küçük kareler regresyonu?


21

Poisson regresyonu, log-link işlevine sahip bir GLM'dir .

Normal olmayan dağılmış sayım verilerini modellemenin alternatif bir yolu, kütüğü (veya daha doğrusu kütüğü (1 + sayımı) 0'ları işlemek için alarak) önişlemektir. Log-count yanıtlarına en küçük kareler regresyonu yaparsanız, bunun Poisson regresyonuyla ilgisi var mı? Benzer olayları kaldırabilir mi?


6
Sıfır sayımların logaritmalarını nasıl almayı planlıyorsunuz?
whuber

3
Kesinlikle eşdeğer değil. Bunu görmenin kolay bir yolu, sıfır sayım gözlemlerseniz ne olacağını görmek. (Yorum @ whuber adlı kullanıcının yorumunu görmeden önce oluşturuldu. Görünüşe göre bu sayfa tarayıcımda uygun bir şekilde yenilenmedi.)
cardinal

Tamam, açıkça şunu söylemeliyim ki, log (1 + count). Açıkçası eşdeğer değil, bir ilişki olup olmadığını veya benzer olayları kaldırabileceklerini merak ediyorum.
Brendan OConnor

1
Bu konunun burada yararlı bir tartışması var: blog.stata.com/2011/08/22/…
Michael Bishop

Yanıtlar:


22

Bir yandan, bir Poisson regresyonunda, model denkleminin sol tarafı beklenen sayının logaritmasıdır: .günlük(E[Y|x])

Öte yandan, "standart" bir doğrusal modelde sol taraf normal yanıt değişkeninin beklenen değeridir: . Özellikle, link işlevi kimlik işlevidir.E[Y|x]

Şimdi, bir Poisson değişkeni olduğunu ve günlüğü alarak onu normalleştirmek istediğinizi varsayalım: Y = log ( Y ) . Çünkü Y ' normale olması gerekiyordu Eğer sol taraf olduğu standart doğrusal modele uyan planı E [ Y ' | x ] = E [ log ( Y ) | x ] . Ancak, genel olarak, E [ log ( Y )YY'=günlük(Y)Y'E[Y'|x]=E[günlük(Y)|x] . Sonuç olarak, bu iki modelleme yaklaşımı farklıdır.E[günlük(Y)|x]günlük(E[Y|x])


6
Aslında, hiç değilse P ( Y = f ( x ) | X ) = 1 bazıları için σ ( X ) -measurable fonksiyonu f yani, Y, tamamen X ile belirlenir . E(log(Y)|X)log(E(Y|X)) P(Y=f(X)|X)=1σ(X)fYX
kardinal

@cardinal. Çok iyi koymak.
suncoolsu

9

İki önemli fark görüyorum.

İlk olarak, öngörülen değerler (orijinal ölçekte) farklı davranır; mantıksal en küçük karelerde koşullu geometrik araçları temsil ederler; log-poisson modelinde şartlı araçları temsil eder. Bu tür bir analizdeki veriler genellikle doğru çarpık olduğundan, koşullu geometrik ortalama, koşullu ortalamayı küçümseyecektir.

İkinci fark ise ima edilen dağılım: lognormal ve poisson. Bu, artıkların heteroskedastisite yapısı ile ilgilidir: beklenen değerle orantılı artık varyansa karşı karesi beklenen değerlerle orantılı artık varyans (lognormal).


-1

Açık bir fark, Poisson regresyonunun nokta tahminleri olarak tamsayılar üreteceği, oysa log-count doğrusal regresyonun tamsayı olmayanları verebileceğidir.


12
Bu nasıl çalışıyor? GLM , zorunlu olarak entegral olmayan beklentileri tahmin etmiyor mu?
whuber

1
Bu doğru değil. Mekanik olarak, poisson regresyonları tamsayısız olmayanlarla başa çıkabiliyor. Standart hatalar poisson dağıtımı olmayacak, ancak bunun yerine sadece güçlü standart hataları kullanabilirsiniz.
Matthew,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.