Poisson regresyon varsayımları ve R'de nasıl test edileceği


11

Regresyonun verilerime en uygun olanını test etmek istiyorum. Bağımlı değişkenim bir sayıdır ve çok sayıda sıfır vardır.

Hangi modeli ve aileyi kullanacağımı (poisson veya quasipoisson veya sıfır şişirilmiş poisson regresyonu) ve varsayımların nasıl test edileceğini belirlemek için biraz yardıma ihtiyacım var.

  1. Poisson Regresyonu: anladığım kadarıyla, güçlü varsayım, bağımlı değişkenin ortalama = varyans olduğudur. Bunu nasıl test edersin? Birlikte ne kadar yakın olmaları gerekiyor? Bunun için koşulsuz veya koşullu ortalama ve varyans kullanılıyor mu? Bu varsayım geçerli değilse ne yapmalıyım?
  2. Varyans ortalamanın üzerinde bir dağılım gösterdiğinde ve bununla başa çıkmanın potansiyel bir yolunun daha bağımsız değişkenler veya family = quasipoisson içerdiğini okudum. Bu dağıtımın başka gereksinimleri veya varsayımları var mı? (1) veya (2) 'nin daha iyi uyup uymadığını görmek için hangi testi kullanıyorum - basitçe anova(m1,m2)?
  3. Ayrıca aşırı dağılım gösterildiğinde negatif-binom dağılımının kullanılabileceğini de okudum. Bunu R'de nasıl yapabilirim? Quasipoisson ile arasındaki fark nedir?
  4. Sıfır şişirilmiş Poisson Regresyonu: Vuong testi kullanmanın hangi modellerin daha uygun olduğunu kontrol ettiğini okudum.

    > vuong (model.poisson, model.zero.poisson)

    Bu doğru mu? Sıfır şişirilmiş regresyon hangi varsayımlara sahiptir?

  5. UCLA Akademik Teknoloji Hizmetleri, İstatistiksel Danışmanlık Grubu sıfır şişirilmiş Poisson Regresyonları hakkında bir bölüme sahiptir ve sıfır şişirilmiş modeli (a) standart poisson modeline (b) karşı test eder:

    > m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
    > m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
    > vuong(m.a, m.b)

| personsİlk modelin ne yaptığını ve bu modelleri neden karşılaştırabileceğinizi anlamıyorum. Regresyonun aynı olmasını ve sadece farklı bir aile kullanmasını bekliyordum.

Yanıtlar:


8

X¯S2F(1,n-1)n

Bu testin değişkenleri göz ardı ettiğini unutmayın - bu durumda muhtemelen aşırı dağılımı kontrol etmenin en iyi yolu değildir.

Ayrıca, bu testin muhtemelen sıfır şişirilmiş hipoteze karşı zayıf olduğuna dikkat edin.

3) negatif R binom: kullanımı glm.nbile ilgili MASSpaket veya kullanım zeroinflişlevini psclolumsuz binom bağlantıyı kullanarak paketi.

4) zip (sıfır şişirilmiş Poisson) bir karışım modelidir. Bir konunun A grubuna (0'ın kesin olduğu yerde) veya B grubuna (sayıların Poisson veya negatif binom dağıtılmış olduğu) ait olduğu ikili bir sonucunuz var. Gözlemlenen bir 0, grup A + 'dan B grubuna ait olan ve şanslı olan deneklere bağlıdır. Modelin her iki yönü de ortak değişkenlere bağlı olabilir: grup üyeliği bir lojistik gibi modellenir (log değişkenleri ortak değişkenlerde doğrusaldır) ve Poisson kısmı her zamanki gibi modellenir: log ortalaması ortak değişkenlerde doğrusaldır. Yani bir lojistik için olağan varsayımlara (belirli 0 kısım için) ve bir Poisson için olağan varsayımlara ihtiyacınız vardır. Başka bir deyişle, bir zip modeli aşırı dağılım problemlerinizi iyileştirmez - sadece büyük bir sıfır sıfırını tedavi eder.

5) veri kümesinin ne olduğundan ve referansı bulamadığından emin değilim. zeroinfl, hem poisson kısmı hem de ikili (belirli 0 veya değil) kısmı için bir modele ihtiyaç duyar. Belirli 0 kısmı ikinci olur. Bu nedenle anne, kişinin belirli bir 0 olup olmadığı "kişilere" bağlı olduğunu ve konunun belirli bir 0 olmadığını varsayarsak, saymanın kampçı ve çocuğun bir işlevi olduğunu söylüyor. Başka bir deyişle log (ortalama), 0 sayımı gerektirmeyen konular için kampçı ve çocuğun doğrusal bir fonksiyonudur.

mb, kampçı ve çocuk açısından sadece genel bir doğrusal modeldir - her ikisinin de sabit etkileri olduğu varsayılır. Bağlantı işlevi Poisson'dur.


Teşekkür ederim! Kısa bir soru: Rm aile içinde poisson = poisson kullanarak Nagelkerke gibi r ^ 2 veya pseudo-r ^ 2 üretmenin bir yolu var mı? Teşekkür ederim!
Torvon

0
  1. kitaplığı (pastecs)

stat.desc (dep_var) - ve sonra ortalama ve varyans eşitse bir göz atın. Buradan ayrıca vektörünüzdeki sıfırların yüzdesini de hesaplayabilirsiniz.


3
Siteye hoş geldiniz. Bu bir cevaptan çok bir yorum gibidir; Ayrıca, doğru yazım ve benzeri kullanmak daha iyidir - bu manifatura değildir ve bu siteyi okuyan birçok kişi 2. veya 3. veya .... dil olarak İngilizce'ye sahiptir.
Peter Flom

3
Lütfen, bu hızlı yanıtı geliştirmeye çalışın.
chl
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.