Sayım verisinde regresyon modellerinin karşılaştırılması


11

Son zamanlarda aynı tahmin / yanıt verileri için 4 çoklu regresyon modeline uydum. Modellerden ikisi Poisson regresyonuna uyuyor.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

Modellerden ikisi negatif binom regresyonu ile uyuyorum.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

Bu modelleri karşılaştırmak için kullanabileceğim istatistiksel bir test var mı? AIC'yi uyum ölçüsü olarak kullanıyorum, ancak AFAIK bu gerçek bir testi temsil etmiyor.


İstatistiksel bir test kullanarak modellerin uyumunu karşılaştırmak istiyorsunuz , değil mi? Ne tür bir hipotezi test etmek istersiniz?
Firefeather

@Firefeather Mesela ben oturması olup olmadığını test etmek istiyorum model.nb.interolduğunu anlamlı daha iyi daha model.pois.inter. Evet, AIC daha düşük, ama ne kadar düşük önemli ölçüde daha iyi ?
Daniel Standage

Not: Bu sorunun cevabının AIC'yi içermesi gerekmez.
Daniel Standage

Bu sorunun cevabını bilmiyorum, ama başlayabilirim. Senin bir kullanabileceğini biliyor karşılaştırmak testi karşı (ve benzer karşılaştırmak karşı ), ancak bir Poisson modeli ve çalışacak bir negatif binom modeli arasındaki karşılaştırmalar garanti edemez. Her bir çiftin varyanslarını karşılaştırmak için bir testinin güvenilir olup olmadığını merak ediyorum . FFmodel.poismodel.pois.intermodel.nbmodel.nb.interF
Firefeather

1
@Firefeather, evet ailevi güven düzeyini kontrol etme ihtiyacının farkındayım. Scheffe burada, Bonferroni'den daha uygun olur mu?
Daniel Standage

Yanıtlar:


14

Olasılık oranı testi ile negatif binom modelini karşılık gelen Poisson modeliyle karşılaştırabilirsiniz. Poisson modeli, aşırı dağılım parametresi sıfır olan negatif bir binom modeline eşdeğerdir. Bu nedenle, iç içe geçmiş modellerdir ve olasılık oranları geçerlidir. Komplikasyon, overdispersion parametresinin negatif olmamasıyla sınırlandırılmasıdır, yani mantıksal olarak sıfırdan az olamaz, bu nedenle boş hipotez, parametre alanının sınırındadır. Bu, log-olasılığını iki serbestlik dereceli bir ki-kare dağılımıyla iki kez karşılaştırmak yerine, bunu 1 df ile bir ki-kare eşit parçalardan ve sıfırdaki bir nokta kütlesinden oluşan bir karışım dağılımıyla karşılaştırmanız gerektiği anlamına gelir. (sıfır serbestlik dereceli ki kare dağılımı). Pratikte bunun anlamı, 1 df ile ki kare kullanarak p değerini hesaplayabilmeniz ve sonra yarıya indirebilmenizdir. Daha fazla ayrıntı ve arka plan için bkz.Self & Liang JASA 1987; 82 : 605-610'da açıklanmaktadır. .

Stata gibi bazı istatistiksel yazılım paketlerinin, negatif bir binom modelini taktığınızda bunları sizin için otomatik olarak yapacağını unutmayın. Aslında Stata yardım sisteminden yukarıdakilerin çoğunu utanmadan topladım - Stata'ya sahipseniz help j_chibar.


5

anova()R'nin bunun için kullanılabileceğine inanıyorum . İsmine rağmen, bir olasılık oranı testi. Crawley'nin The R Book'unda bazı kullanım örnekleri var.


1

Onestop notları olarak, modelleri iç içe olduğundan bir olasılık oranı testi yapabilirsiniz.

Genel olarak bu doğru değildir, bu nedenle iç içe olmayan modelleri karşılaştırmak isterseniz Vuong'un testini kullanabilirsiniz .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.