R'de betareg işlevini kullanarak karışık bir model nasıl uygulanır?


12

Bireysel kurbağa yavrularının "aktivite seviyesini" ölçen oranlardan oluşan bir veri setim var, bu nedenle değerleri 0 ile 1 arasında bağlı hale getiriyorum. Bu veriler, bireyin belirli bir zaman aralığında (hareket için 1, Hiçbir hareket için 0) ve ardından kişi başına bir değer oluşturmak için ortalaması alınır. Ana sabit etkim "yoğunluk seviyesi" olacaktır.

Karşılaştığım sorun, rastgele bir etki olarak dahil etmek istediğim bir faktör değişkeni, "gölet" olması - göletler arasındaki farkları umursamıyorum, ancak istatistiksel olarak hesaba katmak istiyorum. Havuzlar hakkında önemli bir nokta, sadece 3 tane var ve rastgele etkilerle uğraşırken daha fazla faktör seviyesine (5+) sahip olmanın ideal olduğunu anlıyorum.

Bunu yapmak mümkünse , R kullanarak betareg()veya betamix()R kullanarak karışık bir modelin nasıl uygulanacağı konusunda bazı tavsiyeler istiyorum. verilerimi ve çıktı değerlerinin ekolojik terimlerle ne anlama geldiğini) ve örneklerle daha iyi çalışma eğilimindeyim.

İlgili bir notta, glm()bu tür verilerle rastgele efektler için muhasebe yapmak için bunun yerine bir binom ailesi altında ve logit bağlantısı kullanıp kullanamayacağımı merak ediyordum .


hayır glm () içinde hata terimlerini ekleyemezsiniz. Logit yanıtınızı dönüştürmeye ve doğrusal karma bir model düşünmeye ne dersiniz?
utobi

@utobi Teşekkür ederim, bunu deneyeceğim. Yani, sadece 3 seviye ile rastgele bir etkisi olan endişeleriniz yok mu?
Kat Y

Değişken "gölet" inizin anlamını bilmiyorum, ancak tekrarlanan ölçümleriniz varsa, rastgele etkiler neredeyse bir zorunluluktur. Tekrarlanan önlemleriniz yoksa, burada rastgele ve sabit olan açık bir tartışmadır. Üç düzeyde rastgele etki olabilir, prensipte varyansları tahmin edilebilir. Alanınızdaki literatürü kontrol etmenizi öneririm. Rastgele ve sabit etkiler hakkında tartışan güzel bir kitap stat.columbia.edu/~gelman/arm'dır .
utobi

1
@utobi tavsiyeniz için teşekkür ederim. Yardımcı oldu. O kitaba bakacağım! Sonunda logit dönüşümleri yaptım ve lmer () kullandım.
Kat Y

Yanıtlar:


11

Mevcut yetenekleri betaregrastgele / karışık efektler içermez. İçinde betareg(), örneğin üç seviyeli havuz değişkeniniz için sadece sabit efekt ekleyebilirsiniz. betamix()Fonksiyon uygular sonlu karışımı , beta regresyon, bir karışık etki beta regresyon.

Sizin durumunuzda, önce sabit bir havuz faktörü etkisinin nasıl bir etkisi olduğunu görmeye çalışırdım. Rastgele bir etki yalnızca bir ek serbestlik derecesi ile biraz daha ucuz olurken, bu size iki serbestlik derecesine "mal olur". Ancak, iki yaklaşımın çok farklı niteliksel içgörülere yol açması durumunda şaşırırdım.

Son olarak, glm()beta regresyonunu desteklemese de, mgcvpakette işlevle betar()kullanılabilecek aile var gam().


Girişiniz için teşekkürler. Betareg işlevlerinin bazı yönlerini açıkladınız. Bu noktada @utobi'nin tavsiyelerini aldım ve lmer () kullanabilmem için logit dönüşümleri yaptım. Bir sonraki veri setim de 0 ile 1 arasında bağlı olduğu için gam () 'a bakacağım ve dönüşümler yoluyla dağılımları normalleştiremiyorum :)
Kat Y

1
Yaklaşımların benzer sonuçlar ve aynı zamanda bir şeyler öğrenebileceğiniz bazı farklılıklar getirmesini beklerim. Bu yüzden üçünü de denemenizi tavsiye ederim, yani betaregsabit efektlerle, lmerrastgele efektlerle logit dönüşümü ve gamile betar. (Ve ayrıca: Cevap faydalıysa, oylamayı kabul etmeyi veya kabul etmeyi düşünün.)
Achim Zeileis

15

GlmmTMB paketi benzer bir sorusu olan herkes için yararlı olabilir. Örneğin, yukarıdaki sorudaki göleti rastgele bir efekt olarak dahil etmek istiyorsanız, aşağıdaki kod hile yapacaktır:

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

CV'ye hoş geldiniz. Katkınız için teşekkürler. Bu bir cevaptan ziyade bir yorumdur. Cevabınızı uzatabilir misiniz lütfen?
Ferdi

Gecikme için özür dilerim, yorumu hemen görmedim. Umarım yardımcı olur.
Kori K

3

Bu bir yorum olarak başladı, ancak uzun sürdü. Burada rastgele bir efekt modelinin uygun olduğunu düşünmüyorum. Sadece 3 gölet var - 3 sayıdan bir varyansı tahmin etmek istiyor musunuz? Rastgele efekt modeliyle olan biten budur. Ben göletler "Amerika Göletleri" rastgele bir örnek olarak değil, araştırmacı kolaylık nedeniyle seçildi sanırım.

Rastgele efektler modelinin avantajı, havuzdan gölet varyasyonunu dikkate alan tepki (aktivite seviyesi) üzerinde bir güven aralığı oluşturmanıza izin vermesidir. Sabit bir etki modeli - diğer bir deyişle, havuzun bir blok gibi muamele edilmesi - havuz etkisi için tepkiyi ayarlar. Bazı ilave tedavi etkisi varsa - her havuzda iki kurbağa türü diyelim - engelleme ortalama kare hatasını (F testinin paydası) azaltır ve tedavinin etkisinin parlamasını sağlar.

Bu örnekte, herhangi bir tedavi etkisi yoktur ve havuz sayısı rastgele etkiler modeli için çok azdır (ve muhtemelen çok "rastgele olmayan"), bu nedenle bu çalışmadan hangi sonuçların çıkarılabileceğinden emin değilim. Havuzlar arasındaki fark hakkında güzel bir tahmin elde edilebilir, ama bu kadar. Diğer havuz ortamlarında daha fazla kurbağa popülasyonuna yönelik çıkarımlar görmüyorum. Sanırım bunu pilot çalışma olarak çerçeveleyebiliriz.

Burada rastgele etkiler modelinin herhangi bir kullanımının havuz varyansı için çok güvenilir olmayan bir tahmin vereceğini ve Dikkatle Kullanılması gerektiğini unutmayın.

Ama asıl soruya gelince - bu bir oran sorunu değil mi? Birim zamanda olaylar için gidilecek dağıtım Poisson'dur. Böylece Poisson regresyonunu, zaman aralığı olan sayıları ofset olarak kullanarak yapabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.