Sürekli veriler için poisson regresyonu mu kullanıyorsunuz?


11

Poisson dağılımı, sürekli verilerin yanı sıra ayrık verilerin analizinde kullanılabilir mi?

Yanıt değişkenlerinin sürekli olduğu ancak normal dağılım yerine bir poisson dağılımına benzeyen birkaç veri setim var. Bununla birlikte, poisson dağılımı ayrı bir dağılımdır ve genellikle sayılar veya sayımlarla ilgilidir.


Peki ampirik dağılımlarınız Gamma çeşitlerinden nasıl farklıdır?
whuber

1
Bu veriler için gama dağılımını kullandım. Bir günlük bağlantısıyla gama dağılımını kullanırsanız, aşırı dağınık bir poisson modelinden elde ettiğinizle hemen hemen aynı sonucu alırsınız.Ancak, istatistiksel paketlerin çoğunda poisson regresyonuna aşina olduğum daha basit ve çok daha esnektir.
user3136

Daha iyi başka dağıtımlar olmaz mıydı, örneğin whuber'ın gamma önerisi?
Peter Flom

1
@PeterFlom - R'deki glmnet paketi, Gamma ailesini veya bir günlük bağlantı işlevi olan Gauss ailesini desteklemediğinden, bu sorunun çok fazla ortaya çıkıp çıkmadığını merak ediyorum. Bununla birlikte, glmnet öngörücü bir modelleme paketi olarak kullanıldığından (dolayısıyla kullanıcılar katsayı stnd hatalarıyla değil sadece model katsayılarıyla ilgilenmektedir) ve Poisson dbn tutarlı katsayı ürettiğinden. Dağılım ne olursa olsun sürekli yanıt veren ln [E (y)] = beta0 + beta * X modelleri için tahminler, glmnet yazarlarının bu ek aileleri de dahil etmediğini tahmin ediyorum.
RobertF

Yanıtlar:


12

Burada ilgili genelleştirilmiş bir doğrusal modelin temel varsayımı, öngörücülerin değerleri göz önüne alındığında, yanıtın varyansı ve ortalaması arasındaki ilişkidir. Bir Poisson dağılımı belirttiğinizde, bunun koşullu varyansın koşullu ortalamaya eşit olduğunu varsaydığınız anlamına gelir. * Dağıtımın gerçek şekli o kadar önemli değil: Poisson, gama veya normal olabilir, ya da bu ortalama-varyans ilişkisi geçerli olduğu sürece başka bir şey.

* Varyansın ortalamanın orantılılıktan birine eşit olduğu varsayımını rahatlatabilir ve yine de genellikle iyi sonuçlar alabilirsiniz.


9

Genelleştirilmiş bir doğrusal modelde Poisson tepkisi kullanmaktan bahsediyorsanız, evet, her gözlemin varyansının ortalamasına eşit olduğu varsayımını yapmak istiyorsanız.

Bunu yapmak istemiyorsanız, başka bir alternatif yanıtı dönüştürmek olabilir (örneğin günlükleri almak).


Bence, kendi kullanıcısına ek olarak, @ user3136 ortalama = varyans varsayımı yapmaya istekli olmasa bile, quasipoissonailesini kullanabilir glm.
suncoolsu

2
Ama benim sorunum, sürekli verileri neden ayrık hale dönüştürmek istersiniz. Esasen bilgi kaybediyor. Ayrıca basit bir logdönüşüm işe yaradığında, neden verilerinizi farklılaştırmalıyız? glmÇalışmaları kullanma , ancak her sonuç asimtotik tabanlı (ki olabilir veya olmayabilir)
suncoolsu

@ suncoolsu: 1) quasipoisson ortalama varsayımını varyansla orantılı yapar. 2) Farklı bir model kullanabilmeniz için ayrık dönüşümü kastetmedim (sürekliliği korumak) demek istedim.
Simon Byrne

evet - Anladım sana katılıyorum. Üzgünüm, bu soru hakkında konuşuyordum. Quasi-poisson, overdisperson'ı dikkate alıyor değil mi? (doğru hatırlamıyorsam, Faraway 2006)
suncoolsu

Bu örnekte, denediğim herhangi bir dönüşümün (log, sqrt, box-cox) normalliğe iyi bir yaklaşım sağladığı konusunda tatmin olmadım. Bu arada, normal puan dönüşüm yöntemini kullanırsam, çoğu veriyi neredeyse güzel normale dönüştürebilirim, ancak bu dönüşümü yaygın olarak kullanmadım, bu yüzden bir yakalama olduğunu varsayıyorum (geri dönüştürmek zor).
user3136
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.