Bir orantı veya kesir olan bir yanıt değişkenine binom GLMM (glmer) takma


11

Birisinin nispeten basit bir soru olduğunu düşündüğüm şeylere yardımcı olabileceğini umuyorum ve bence cevabı biliyorum ama onaylamadan emin olamayacağım bir şey haline geldi.

Yanıt değişkeni olarak bazı sayım verileri var ve bu değişken bir şeyin orantılı varlığı ile nasıl değiştiğini ölçmek istiyorum.

Daha ayrıntılı olarak, yanıt değişkeni, bir dizi alanda bir böcek türünün varlığının sayımlarıdır, bu nedenle örneğin bir saha 10 kez örneklenir ve bu tür 4 kez ortaya çıkabilir.

Bunun, bu bölgelerdeki bitkilerin genel topluluğundaki bir grup bitki türünün oransal varlığıyla ilişkili olup olmadığını görmek istiyorum.

Yani verilerim aşağıdaki gibi görünüyor (bu sadece bir örnek)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

Veriler ayrıca konum için rastgele bir efekt içerir.

İki yöntem düşündüm, biri lmerböcekler bir orana dönüştürülmüş doğrusal bir model ( ) olurdu örneğin

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

İkincisi bir binom GLMM ( glmer) olacaktır;

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

Binom ışıltısının doğru yöntem olduğuna inanıyorum, ancak oldukça farklı sonuçlar üretiyorlar. Hala biraz belirsiz hissetmeden net bir kesin cevap bulamıyorum ve bir hata yapmadığından emin olmak istiyorum.

Bu konuda alternatif yöntemlerle ilgili herhangi bir yardım veya fikir çok takdir edilecektir.


Yanıtlar:


20

Binom GLMM muhtemelen doğru cevaptır.

  • Özellikle az ila orta sayıda örnekte (örneğin 9 ve 10) yanıt değişkeninin dağılımı muhtemelen heterossedastik olacaktır (varyans sabit olmayacak ve özellikle sistematik yollarla ortalamaya bağlı olacaktır) ve uzak Normallikten, dönüşümü zor olacak bir şekilde - özellikle de öngörücü değişkenin bazı değerleri için oranlar 0 veya 1'e yakınsa. Bu GLMM'yi iyi bir fikir yapar.
  • Aşırı dağılma olup olmadığını kontrol etmeye / hesaba katmaya dikkat etmelisiniz. Konum başına tek bir gözleminiz varsa (yani veri çerçevenizdeki tek bir binom örneği / satırı), (1|Site)rastgele etkiniz bunu otomatik olarak halledecektir (uyarı notu için Harrison 2015'e bakın)
  • önceki varsayım doğruysa (konum başına yalnızca tek bir binom örneğiniz varsa), bunu normal bir binom modeli olarak da ekleyebilirsiniz ( glm(...,family=binomial)- bu durumda family=quasibinomialdaha basit ve alternatif bir yol olarak bir kuasibinom modeli ( ) da kullanabilirsiniz ) aşırı dağılmayı hesaba katmak
  • isterseniz, weightsargümanınızı örnek sayısına eşit olacak şekilde ayarladıysanız, GLMM'nizi yanıt oranıyla da sığdırabilirsiniz :

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (bu glmer(), sorunuzdaki uyum için aynı sonuçları vermelidir ).

Harrison, Xavier A. “ Ekoloji ve Evrimde Binom Verilerinde Aşırı Dağılımın Modellenmesinde Gözlem Düzeyinde Rasgele Etki ve Beta-Binom Modelleri Karşılaştırması .” PeerJ 3 (21 Temmuz 2015): e1114. doi: 10,7717 / peerj.1114.


Merhaba Ben, Açık ve kapsamlı cevabınız için çok teşekkürler!
ALs
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.