Son zamanlarda, bir oran olan bir sonuç için bir beta regresyon modeli uygulamakla ilgileniyorum. Bu sonucun binom bağlamına uymayacağını unutmayın, çünkü bu bağlamda ayrı bir "başarı" için anlamlı bir kavram yoktur. Aslında, sonuç aslında sürelerin bir oranıdır; pay belirli bir koşul aktifken, koşulun aktif olmaya uygun olduğu toplam saniye sayısı boyunca saniye sayısıdır. Vagaryerler için özür dilerim, ancak bu kesin bağlama çok fazla odaklanmak istemiyorum, çünkü beta regresyonunun yanı sıra böyle bir sürecin modellenmesinin çeşitli yolları olduğunu anlıyorum ve şimdilik teorik olarak daha fazla ilgileniyorum Böyle bir modeli uygulama girişimlerimde ortaya çıkan sorular (tabii ki,
Her durumda, bulabildiğim tüm kaynaklar, beta regresyonunun tipik olarak bir logit (veya probit / cloglog) bağlantısı kullanarak ve log-odds'taki değişiklikler olarak yorumlanan parametrelerin uygun olduğunu gösterdi. Ancak, neden bu bağlantıyı kullanmak istediğine dair gerçek bir gerekçe sağlayan bir referans bulmadım.
Orijinal Ferrari ve Cribari-Neto (2004) makalesi bir gerekçe sunmamaktadır; sadece logit fonksiyonunun üslü parametrelerin olasılık oranı yorumlaması nedeniyle "özellikle yararlı" olduğunu not ederler. Diğer kaynaklar (0,1) aralığından gerçek çizgiye eşleme arzusunu ifade eder. Ancak, zaten bir beta dağıtımı varsaydığımız düşünüldüğünde, böyle bir eşleme için mutlaka bir bağlantı fonksiyonuna ihtiyacımız var mı? Bağlantı işlevi, beta dağıtımının başlayacağı varsayılarak getirilen kısıtlamaların üzerinde ve ötesinde ne gibi faydalar sağlar?Birkaç hızlı simülasyon çalıştırdım ve olasılık kütlesi büyük ölçüde 0 veya 1'e yakın olan beta dağılımlarından simüle ederken bile, bir kimlik bağlantısıyla (0,1) aralığının dışında tahmin görmedim, ancak belki de benim simülasyonlarım Bazı patolojileri yakalayacak kadar genel değil.
Bana öyle geliyor ki, bireyler, uygulamada, beta regresyon modellerinden (yani oran oranları olarak) parametre tahminlerini dolaylı olarak bir "başarı" olasılığına ilişkin olarak çıkarımda bulundukları şekilde nasıl yorumladıklarına dayanmaktadır; yani, beta regresyonunu bir binom modelinin yerine kullanıyorlar. Belki de bu, beta ve binom dağılımları arasındaki ilişki göz önüne alındığında, bazı bağlamlarda uygundur, ancak bana göre, bunun genel olandan daha özel bir durum olması gerekir. Gelen bu soruya bir cevap yerine sonucun daha sürekli oranına göre, risk oranı yorumlamak için sağlanan, ancak, diyelim ki, bir günlük kullanımının aksine, denemek ve şeyler bu şekilde yorumlamak gereksiz yere hantal olması bana öyle geliyor veya kimlik bağlantısı ve% değişikliklerin veya birim kaymalarının yorumlanması.
Peki, beta regresyon modelleri için neden logit bağlantısını kullanıyoruz? Basitçe bir kolaylık meselesi olarak, onu binom modelleri ile ilişkilendirmek mi?