Sıfır kesik negatif binom GEE için R / Stata paketi?


13

bu benim ilk yazım. Bu topluluk için gerçekten minnettarım.

Sıfır kesilmiş (yanıt değişkeni = 0 olması olasılığı) uzunlamasına sayım verilerini ve ortalama! = Varyansı analiz etmeye çalışıyorum, bu nedenle bir poisson üzerinde negatif bir binom dağılımı seçildi.

Dışarıda bıraktığım işlevler / komutlar:

R,

  • R'deki gee () işlevi sıfır kesmeyi veya negatif binom dağılımını (MASS paketi yüklü olsa bile) açıklamaz
  • R'deki glm.nb () farklı korelasyon yapılarına izin vermez
  • VGAM paketinden vglm () posnegbinomial ailesini kullanabilir, ancak bağımsız olmayan bir korelasyon yapısı kullanarak modelleri yeniden yerleştiremediğim için Stata'nın ztnb komutu (aşağıya bakınız) ile aynı soruna sahiptir.

Stata

  • Veriler boylamsal değilse, analizimi çalıştırmak için sadece Stata paketleri ztnb'yi kullanabilirim, ancak bu komut gözlemlerimin bağımsız olduğunu varsayar.

Ayrıca çeşitli metodolojik / felsefi nedenlerle GLMM'yi de dışladım.

Şimdilik, Stata'nın xtgee komutuna karar verdim (evet, xtnbreg'in de aynı şeyi yaptığını biliyorum), hem bağımsız olmayan korelasyon yapılarını hem de negatif binom ailesini hesaba katar, ancak sıfır kesmeyi değil. Xtgee kullanmanın ek yararı, yanıt değişkenlerim için en uygun korelasyon yapılarını belirlemek için qic değerlerini de (qic komutunu kullanarak) hesaplayabilmemdir.

R veya Stata'da 1) nbinomiyal aile, 2) GEE ve 3) sıfır kesmeyi dikkate alabilecek bir paket / komut varsa, bilmek için ölmek isterim.

Sahip olabileceğiniz herhangi bir fikri çok takdir ediyorum. Teşekkür ederim.

-Casey

Yanıtlar:


12

R için iki seçenek akla geliyor, her ikisi de en iyi ihtimalle sadece belirsiz bir şekilde aşina olduğum.

Birincisi, psclsıfır kesilmiş şişirilmiş ve engelli modellere çok güzel, esnek bir şekilde sığabilen paket . psclPaket kullanımını önermektedir sandwich"enine kesit, zaman serisi ve boylamasına veriler için Model sağlam standart hata tahmin edicileri" içerir paket. Böylece sayım modelinize sığabilir ve daha sonra sandwichverilerin uzunlamasına doğasını göz önünde bulundurarak kalanlar için uygun bir kovaryans matrisi tahmin etmek için paketi kullanabilirsiniz .

İkinci seçenek, geepackistediğinizi yapabileceği gibi görünen pakete bakmak olabilir, ancak R'nin glm()işlevinin yapabileceği herhangi bir GLM türüne uyacağı için sadece bilinen teta ile negatif bir binom modeli için (bu nedenle MASS'ın aile işlevini kullanın) .

Üçüncü bir seçenek de kafasını yükseltti: gamlssve eklenti paketi gamlss.tr. İkincisi, gen.trun()desteklenen dağıtımlardan herhangi birini gamlss()esnek bir şekilde kesilmiş bir dağılıma dönüştürebilen bir işlev içerir - örneğin 0 negatif binom dağılımında kesilmiş sola belirtebilirsiniz. gamlss()kendisi verilerin uzunlamasına doğasına dikkat etmesi gereken rastgele etkiler için destek içerir. Bununla birlikte, modelde bir eş değişkenin en az bir pürüzsüz işlevini kullanmak zorundaysanız veya her şeyi bir GLM'deki gibi doğrusal işlevler olarak modelleyebiliyorsanız hemen net değildir.


Bence pscl paketi sadece sıfır şişirilmiş ve engelli modellere uyar. Engel modelleri, hem sol kesik sayma bileşenini hem de sağ sansürlü engel bileşenini içerir. Engel bileşeni olmadan bir engel modelini nasıl çalıştırabilsem bile yapamam, ama sandwick paketine bakacağım. Geepack paketine gelince, gee paketi ile aynı soruna sahip gibi görünüyor; Bir teta belirtmeden bir "negative.binomial" ailesi (MASS'tan) belirlediğimde, bir teta ister. Ancak, bir teta değeri belirttiğimde, tanınmayan bir aile olduğunu söyleyen bir hata verir.
Iris Tsui

@Casey - özür dilerim sıfır kesim yeniden ihtiyaçlarınızı yanlış okudum. Utanç o aile işleviyle çalışmaz. Başka bir şey düşünürsem, burada güncelleme yapacağım.
Monica'yı eski durumuna döndürün - G. Simpson

@Casey Paketle ilgili gamlssR notuna da uyabilecek bir not ekledim .
Monica'yı eski durumuna döndürün - G. Simpson

Anlayışımı geliştiren kaynaklar ve işlevler için birden fazla öneri nedeniyle cevabınızı kabul etmek. Görünüşe göre 'gamlss' sorunumu çözmenin olası bir yolu olurdu, ama aslında istatistikçi olmayan biriyim, şu anda matematikte arka planım yok ya da şu anda bu kutu solucanlarını açamıyorum (ama belki sonunda yapacağım). Başka bir yorumda belirtildiği gibi, en azından verilerim için, sıfır kesmeyi göz ardı etmek tahminlerimi ve std hatalarını çok fazla değiştirmeyecek gibi görünüyor. Hedeflediğim kitleye göre, nbinom bir GEE'nin gayet iyi olacağına inanıyorum. Teşekkürler!
Iris Tsui

9

Hmm, güzel ilk soru! Kesin gereksinimlerinizi karşılayan bir paket bilmiyorum. Huber-White standart hatalarını verme seçeneğini de belirlerseniz veya bu pratikse , Stata'nın xtgee'sinin iyi bir seçim olduğunu düşünüyorum . Bu seçeneklerden herhangi biri, sıfır kesmeyi göz ardı ederek sahip olacağınız model yanlış tanımlamasına rağmen standart hataların tutarlı bir şekilde tahmin edilmesini sağlayacaktır.vce(robust)vce(bootstrap)

Bu, sıfır kesmeyi göz ardı etmenin sizi ilgilendiren nokta tahminleri üzerinde ne gibi bir etkisi olacağı sorusunu bırakır. Genel olarak bu konuda ilgili literatür olup olmadığını, yani mutlaka bir GEE bağlamında olmadığını görmek için hızlı bir arama yapmaya değer - bu tür sonuçların GEE vakasında da alakalı olacağını oldukça güvenli bir şekilde kabul edebileceğinizi düşünürdüm. Hiçbir şey bulamazsanız, verileri her zaman sıfır kesme ve bilinen etki tahminleriyle simüle edebilir ve eğilimi simülasyonla değerlendirebilirsiniz.


1
Sağlam standart hataları tahmin ettiğimden emin oldum. Ayrıca, Zuur, et al, 2009, sayfa 261'deki "R ile ekolojide karışık efekt modelleri ve uzantıları" kitabında, yanıt değişkeninin ortalaması nispeten büyükse, kesme problemini görmezden geldikten sonra, bir Poisson veya negatif binom (NB) genelleştirilmiş doğrusal modelin (GLM) bir soruna yol açma olasılığı düşüktür. " Neyse ki, cevap değişkenlerimin araçları büyük, bu yüzden regresyonlarımın GEE ve negbinomial yönlerine kıyasla sıfır kesmeyi depititize eden biraz daha rahat hissediyorum.
Iris Tsui

Bu konu hakkında benden daha çok şey biliyor gibisin! Ya da bu sitedeki herhangi bir kişi, diğer yanıtların eksikliğine karar vererek.
onestop

Biraz inanılmaz; aşırı dağılmış boyuna sayım verilerinin analiz edilmesinin çok zor olacağını kim bilebilirdi (henüz yapmadım bir GLMM yapmadan) Sadece verilerim sıfır şişirilmiş olsaydı, bu başka bir hikaye olurdu.
Iris Tsui

5

Tezimde de aynı sorun vardı. Stata'da kendimi iki xtgee çağrısı ile özel bir .ado programı oluşturdum.

Bunun için Partha Deb, Willard Manning ve Edward Norton'un "Sağlık Bakım Maliyetlerini ve Sayımlarını Modelleme" slaytlarını / programlarını faydalı buldum. Boyuna verilerden bahsetmezler, ancak yararlı bir başlangıç ​​noktasıdır.


1

GlmmADMB yorumuyla ilgili cevaplar arıyordum ve yazınızı gördüm. Çok uzun zaman önceydi ama biliyorum.

Engelli modelleri kullanırken glmmADMB paketine bakın. Verilerinizin analizlerini ikiye bölmelisiniz: bunlardan biri sıfır verisi yok. Karışık efektler ekleyebilir ve dağıtımı seçebilirsiniz. Durum, verilerin sıfır şişirilmiş olması gerektiğidir ve bunun gereksinimlerinizi karşılayıp karşılamadığını bilmiyorum! Her neyse, umarım uzun zaman önce öğrenmişsindir!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.