Verilerimle bir model oluşturmak için kullanılacak doğru dağıtım hakkında bir sorum var. 50 arsa ile bir orman envanteri yaptım, her arsa 20m × 50m ölçülerinde. Her arsa için, zemini gölgeleyen ağaç gölgelik yüzdesini tahmin ettim. Her çizimin gölgelik örtüsü için yüzde olarak bir değeri vardır. Yüzdeler 0 ila 0.95 arasındadır. Uydu görüntülerine ve çevresel verilere dayanan bağımsız X değişkenlerinden oluşan bir matris ile yüzde ağaç gölgelik örtüsü modeli ( Y değişkeni) yapıyorum .
Binom dağılımını kullanmam gerekip gerekmediğinden emin değilim, çünkü binom rasgele değişken n bağımsız denemenin (yani Bernoulli rasgele değişkenler) toplamıdır . Yüzde değerleri denemelerin toplamı değildir; gerçek yüzdelerdir. Üst sınırı olmasa da gama kullanmalı mıyım? Yüzdeleri tam sayıya dönüştürmeli ve Poisson'u sayı olarak kullanmalı mıyım? Sadece Gaussian'a sadık kalmalı mıyım? Literatürde veya yüzdeleri bu şekilde modellemeye çalışan ders kitaplarında pek fazla örnek bulamadım. Herhangi bir ipucu veya öngörü takdir edilmektedir.
Cevaplarınız için teşekkür ederim. Aslında, beta dağıtımı tam olarak ihtiyacım olan şey ve bu makalede ayrıntılı olarak tartışılıyor:
Eskelson, BN, Madsen, L., Hagar, JC ve Temesgen, H. (2011). Beta regresyon ve kopula modelleri ile Riparian bitki örtüsü örtüsünün tahmin edilmesi. Orman Bilimi, 57 (3), 212-221.
Bu yazarlar, Cribari-Neto ve Zeileis tarafından R'deki betareg paketini kullanıyorlar.
Aşağıdaki makalede, beta-dağıtılmış yanıt değişkenini, yüzdeler aralığında gerçek 0 ve / veya 1 içerdiğinde dönüştürmenin iyi bir yolu açıklanmaktadır:
- Smithson, M. ve J. Verkuilen, 2006. Daha iyi bir limon sıkacağı mı? Beta-dağıtılmış bağımlı değişkenlerle maksimum olabilirlik regresyonu , Psikolojik Yöntemler, 11 (1): 54-71.