Bir sigorta ortamında hasar sayısı modelini modellerken, Poisson ile başladım, ancak aşırı dağılım olduğunu fark ettim. Bir Quasi-Poisson, temel Poisson'dan daha büyük ortalama varyans ilişkisini daha iyi modelledi, ancak katsayıların hem Poisson hem de Quasi-Poisson modellerinde aynı olduğunu fark ettim.
Bu bir hata değilse, neden oluyor? Quasi-Poisson'u Poisson'a göre kullanmanın faydası nedir?
Dikkat edilmesi gerekenler:
- Altta yatan kayıplar aşırı derecede, ki bu da (sanırım) Tweedie'nin çalışmasını engelledi - ama denediğim ilk dağıtımdı. Ayrıca NB, ZIP, ZINB ve Hurdle modellerini de inceledim, ancak yine de Quasi-Poisson'un en iyi uyumu sağladığını gördüm.
- AER paketindeki dispersiyon testi ile aşırı dağılım için test yaptım. Dispersiyon parametresim yaklaşık 8.4 idi, p-değeri 10 ^ -16 büyüklüğündeydi.
- Ben aile = poisson veya quasipoisson ve kod için bir günlük bağlantısı ile glm () kullanıyorum.
- Poisson kodunu çalıştırırken, "In dpois (y, mu, log = TRUE): tamsayı olmayan x = ..." uyarıları ile geliyorum.
Ben'in rehberine göre faydalı SE Konuları:
Bir Tweedie dağılımı daha iyi bir fikir olmaz mı?
—
duffymo
Tweedie'yi hareket halindeyken denedim, ancak kayıp verilerimiz temel değil, aşırı bir temelde. Sayım dağılımını ele almak için Negatif Binom, ZIP ve engel modellerini de denedi.
—
Frank H.
verilerinizdeki tamsayı olmayan değerlerin nereden geldiği hakkında biraz daha açıklayabilir misiniz?
—
Ben Bolker
Eğer olmamalı oranları hesaplayarak modeli frekansları / oranları
—
Ben Bolker
counts/exposure
. Aksine, offset(log(exposure))
modellerinize bir offset ( ) terimi eklemelisiniz .
Her ne kadar Poisson (yarı-Poisson değil) modellemesi yaparken en önemlisi pratiktir. İyi bir referansı açıkça bilmiyorum; CrossValidated'da ilgili bir cevap bulamazsanız, iyi bir takip sorusu olacaktır.
—
Ben Bolker