Poisson regresyonunda sağlam standart hatalar ne zaman kullanılır?


10

Ben sayım verileri için bir Poisson regresyon modeli kullanıyorum ve nedenleri olup olmadığını merak ediyorum değil parametre tahminleri için sağlam standart hata kullanılır? Özellikle, sağlam olmayan tahminlerimin bazıları önemli olmadığından (örneğin, p = 0.13), ancak güçlü olan tahminlerimin önemli olmasından endişe duyuyorum (p <0.01).

SAS'ta bu, proc genmod(örn repeated subject=patid;.) İçindeki tekrarlanan ifade kullanılarak kullanılabilir . Http://www.ats.ucla.edu/stat/sas/dae/poissonreg.htm'yi Cameron ve Trivedi (2009) tarafından sağlam standart hataların kullanılmasını destekleyen bir makaleye atıfta bulunan örnek olarak kullanıyorum .

Yanıtlar:


6

Genel olarak, hatalarınızın heteroskedastik olduğu konusunda herhangi bir şüpheniz varsa, sağlam standart hatalar kullanmalısınız. Güçlü SE'ler kullanmadığınızda tahminlerinizin önemsiz hale gelmesi, güçlü SE'lere olan ihtiyacı gösterir (ancak kanıtlamaz)! Bu SE'ler, heteroskedastisitenin genelleştirilmiş doğrusal bir modelde neden olabileceği önyargıya "dayanıklıdır".

Ancak bu durum biraz farklıdır, çünkü onları Poisson regresyonunun üstüne koyuyorsunuz.

Poisson, verilerin bunu destekleyip desteklemediğine bakılmaksızın dispersiyonu ortalamaya eşit olmaya zorladığı iyi bilinen bir özelliğe sahiptir. Sağlam standart hataları düşünmeden önce, bu sorundan muzdarip olmayan bir Negatif Binom regresyonu deneyeceğim. Standart hatalarda meydana gelen değişikliğin önemli olup olmadığını belirlemeye yardımcı olacak bir test vardır (açıklamaya bakınız).

Gördüğünüz değişikliğin (sağlam SE'lere geçişin CI'yi daraltıp azaltmadığı) kesin dağılma anlamına gelip gelmediğinden emin değilim, ama muhtemelen görünüyor. Uygun modele bir göz atın (negatif binom olduğunu düşünüyorum, ancak hızlı bir googling de düşük dağılım için yarı Poisson mu önerir?) Ve bu ortamda ne elde ettiğinizi görün.


Güzel cevap! Tipik olarak OLS heteroskedastisitesinde parametrelerin nötr olmasına (sadece verimsiz) neden olmaz. Genelleştirilmiş doğrusal modeller için bu doğru değildir, referanslar için Dave Giles'ın bu yazısına bakın . Vuong testini bunun için önerdiğimi sanmıyorum (iç içe geçmiş sıfır şişirilmiş modellerin karşılaştırılması için önerdiğini gördüm). Poisson Neg içinde yuvalanmıştır. Binom modeli, böylece dağılım parametresi için bir olasılık oranı testi kullanabilirsiniz.
Andy W

Cevabınız için teşekkürler. Negatif Binom regresyonunu denedim ama şu uyarıda bulundum: "0.0046138565'in göreli Hessian yakınsama kriteri 0.0001 sınırından daha büyük. Yakınsama tartışmalıdır." Yanıt değişkenimin 0 ile 4 arasında değişen değerlere sahip bir sayı olduğunu unutmayın. Bağımlı veya bağımsız değişkenin yakınsamaya yardımcı olacak bir dönüşümü var mı? Ya da bu durumda ne yapar?
kara

Ayrıca, sağlam olmayan SE'lerin daha küçük olmasıyla ilgili olarak - analizimde, daha küçük olan güçlü SE'ler olduğunu görüyorum ve burası önem taşıyor (sağlam olmayan sonuçlarda değil). Bu yüzden sağlam sonuçları rapor edip etmemeye dikkat etmek istiyorum - sadece önemli değerler nedeniyle bu yöntemi seçmek istemiyorum! Tekrar teşekkürler!
kara

@AndyW Notlarımı kontrol ettim ve Vuong gerçekten ZI vs Poisson için. Güncelleme yayınlandı. kara Geri dönüşü kaçırdım. Eğer dağınık veri olabilir, bu durumda NBD de potansiyel çözüm :-)
Ari B. Friedman

@kara Yakınsama probleminizi yorumlarda teşhis etmek zor. Bu konuda verebileceğiniz kadar bilgi içeren yeni bir soru denerdim.
Ari B. Friedman

1

Gerçekte değiştirilebilir bir tanım olan "GEE'ler" olarak adlandırdığından, modele dayalı sağlam standart hatalara karşı analizleri farklılaştıracağım. Scortchi'nin fantastik açıklamasına ek olarak:

GEE'ler küçük numunelerde "yanlı" olabilir, yani 10-50 denek: (Lipsitz, Laird ve Harrington, 1990; Emrich ve Piedmonte, 1992; Sharples ve Breslow, 1992; Lipsitz ve diğerleri, 1994; Qu, Piedmonte ve Williams, 1994; Gunsolley, Getchell ve Chinchilli, 1995; Sherman ve le Cessie, 1997.) GEE'lerin önyargılı olduğunu söylediğimde, standart hata tahmininin küçük veya sıfır hücre sayımı nedeniyle muhafazakar veya anti-muhafazakar olabileceğidir. hangi uygun değerlerin bu davranışı sergilediğine ve bunların regresyon modelinin genel eğilimiyle ne kadar tutarlı olduğuna bağlı olarak.

Genel olarak, parametrik model doğru bir şekilde belirtildiğinde, yine de model tabanlı CI'lerden doğru standart hata tahminlerini alırsınız, ancak GEE'yi kullanmanın tüm amacı bu çok büyük "if" e uyum sağlamaktır. GEE'ler istatistikçinin sadece veriler için bir çalışma olasılık modeli belirtmesine izin verir ve parametreler (kesin olarak parametrik çerçevede yorumlanmak yerine), altta yatan, bilinmeyen veri üretimine bakılmaksızın tekrarlanabilir değerler üretebilen bir tür "elek" olarak kabul edilir mekanizması. Bu, GEE'nin bir örneği olduğu yarı parametrik analizin kalbi ve ruhudur.

GEE'ler ayrıca, bağımsız bir korelasyon matrisinin belirtilmesine rağmen, verilerdeki ölçülmemiş eşdeğerleştirme kaynaklarını da ele alır. Bunun nedeni, model tabanlı kovaryans matrisinden ziyade ampirik kullanımıdır. Poisson modellemesinde, örneğin, çeşitli derelerden örneklenen somonun doğurganlık oranları ile ilgilenebilirsiniz. Dişi balıklardan hasat edilen ova, altta yatan bir Poisson dağılımına sahip olabilir, ancak paylaşılan kalıtsallık ve belirli akarsulardaki mevcut kaynaklardan oluşan genetik varyasyon, bu akarsulardaki balıkları diğer akarsulardan daha benzer hale getirebilir. GEE, örnekleme oranı nüfus oranlarıyla tutarlı olduğu sürece (ya da başka şekillerde tabakalı olduğu sürece) doğru nüfus standardı hata tahminlerini verecektir.


1

Eşit dağılımın boşluğunu test edersiniz. Basit bir yardımcı OLS regresyonu. Cameron ve Trivedi'nin 670. sayfasında açıklama var . Büyük overdispersion ile standart hatalar çok söner, bu yüzden overdispersiyon olduğunda sağlam olmayan bir VCE'ye bağlı olan sonuçlardan çok dikkatli olurum. Düşük dağılma ile, tam tersi doğru olacaktır, bu da içinde bulunduğunuz senaryo gibi görünür.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.