Sayım verilerinin varyansının parametrik modellenmesi


12

Bazı verileri modellemek istiyorum, ancak ne tür bir model kullanabileceğimden emin değilim. Sayım verilerim var ve verilerin ortalaması ve varyansı için parametrik tahminler verecek bir model istiyorum. Yani, çeşitli tahmin faktörlerim var ve bunlardan herhangi birinin varyansı etkileyip etkilemediğini belirlemek istiyorum (sadece grup ortalamasını değil).

Poisson regresyonunun işe yaramayacağını biliyorum, çünkü varyans ortalamaya eşittir; bu varsayım benim durumumda geçerli değil, bu yüzden aşırı dağılım olduğunu biliyorum. Bununla birlikte, negatif bir binom modeli, modeldeki yordayıcıların bir fonksiyonu olan değil, sadece tek bir aşırı dağılım parametresi üretir. Hangi model bunu yapabilir?

Ayrıca, modeli tartışan bir kitap veya makaleye ve / veya modeli uygulayan bir R paketine yapılan bir başvuru da takdir edilecektir.


1
Önce Poisson regresyonunu yapmadan aşırı dağılım olduğunu nereden biliyorsunuz? Sonuçta, ham (yanıt) değerlerinin ortalamaları ile ortalamasının karşılaştırılması önemli değildir: önemli olan Poisson modelinin uyum iyiliğidir (bu, değerlendirme ile karşılaştırıldığında lineer bir modelde artıkların dağılımını değerlendirmenin analogudur yanıt değişkeninin dağılımı). Bunu ortaya koymanın bir başka yolu, bağımsız değişkenler ve yanıt arasındaki bağlantının, güzel bir şekilde doğru Poisson modelinde bile aşırı dağılma görünümü oluşturabilmesidir.
whuber

2
@whuber Bu adil bir nokta. Alt grupların varyansına ve ortalamasına bakan tek bir kategorik öngörücü için aşırı dağılımın tespit edilmesi yeterli olacaktır, ancak çok değişkenli bir Poisson regresyonu için bu yeterli değildir. Tartışma uğruna, hem Poisson hem de negatif binomal regresyonun yapıldığını varsayalım ve negatif binomiyal, anova model karşılaştırması yoluyla daha iyi bir uyum gösterdiğini varsayalım. Bu aşırı dağılım göstermelidir. Bu göz önüne alındığında, varyans / aşırı dağılım, sabit değil parametrik olarak nasıl modellenebilir?
Brian Diggs

1
McCullagh ve Nelder'da Genelleştirilmiş doğrusal modeller, 2. baskı , bunu kapsayan bir bölüm olduğunu düşünüyorum (ancak kopyam iş başında) ... gerçek bir olasılık olmayacak, ancak yarı olasılık kullanabilirsiniz ve böylece bölümün başlığı olabilir. Karşılık gelen bir olasılık modeli olmamasına rağmen, tekrarlanan ağırlıklı en küçük kareleri uygularsınız.
Karl

McCullagh ve Nelder'in 10. Bölümü, Ortalama ve Dispersiyonun Ortak Modellemesini tartışıyor, yani hem ortalamayı hem de varyansı parametrelendiriyor. Genişletilmiş yarı olabilirlik ana araçtır, ancak bazı durumlarda bu yöntemle ilgili endişeler
konuk

Yanıtlar:


9

Negatif binom dağılım parametresini, R'deki gamlss paketini kullanarak değişkenlerin ve parametrelerin bir fonksiyonu olarak modelleyebilirsiniz. Bir girişten bir alıntı sağlarım:

Neden GAMLSS kullanmalıyım?

Yanıt değişkeniniz sayım (ayrık) veriler ise, Poisson dağılımının iyi uymaması muhtemeldir. GAMLSS, deneyebileceğiniz çeşitli ayrık dağılımlar (negatif binom dahil) sağlar. Dispersiyon parametresi, açıklayıcı değişkenlerin bir fonksiyonu olarak da modellenebilir.

Www.gamlss.org web sitesinde, pakette kullanılan yaklaşımlarla ilgili belgeler ve birçok makaleye bağlantılar bulunmaktadır.


Her iki yanıt da faydalıdır ve iyi referanslar sağlar. Bu ödülün ödülünü veriyorum çünkü (a) diğerinden dört dakika önce geldi ve (b) gamlss çözümü benim için yeni (nbreg'e aşinayım). Ama iyi bir yanıt verdiğinden @timbp'ye şapka çıkar; Umarım sitemize katkıda bulunmaya devam edersiniz.
whuber

2
@whuber, her ikisi de çok yardımcı olduğu için "cevap" olarak kabul edileceği için de parçalandım. Kullanabileceğim bir R paket referansı içerdiğinden bununla gittim; diğer cevaptaki kitap referansı iyi bir okuma olmuştur ve iskonto edilmemelidir. Bu iki iyi cevabı veren ödülü sunduğunuz için teşekkür ederiz.
Brian Diggs

9

Stata, dispersiyon parametresini modellemenizi sağlayan -gnbreg- komutunu sağlar. Komuta ilişkin Stata yardımını http://www.stata.com/help.cgi?nbreg adresinde görebilirsiniz.

Stata buna genelleştirilmiş negatif binom modeli diyor. Joseph Hilbe bunu "Negatif Binom Regresyonu", bölüm 10.4'te "NB-H: Heterojen negatif binom regresyonu" olarak tartışır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.