[0,1] 'de beta regresyonu ile analiz etmek istediğim verilerim var. Tabii ki 0,1 değerlerini karşılamak için bir şeyler yapılmalıdır. Bir modele uyacak şekilde veri değiştirmeyi sevmiyorum. Ayrıca sıfır ve 1 enflasyonun iyi bir fikir olduğuna inanmıyorum çünkü bu durumda 0'ın çok küçük pozitif değerler olduğunu düşünmeliyim (ama tam olarak hangi değerin uygun olduğunu söylemek istemiyorum. Makul bir seçim) Ben .001 ve .999 gibi küçük değerleri seçmek ve beta için kümülatif dağıtım kullanarak modele uyacağına inanıyorum.Bu yüzden y_i gözlemleri için log olasılığı LL_iwould
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
Bu model hakkında sevdiğim, beta regresyon modeli geçerliyse bu modelin de geçerli olması, ancak aşırı değerlere olan duyarlılığın bir kısmını kaldırmasıdır. Ancak bu öyle doğal bir yaklaşım gibi görünüyor ki, literatürde neden belirgin referanslar bulamadığımı merak ediyorum. Benim sorum, verileri değiştirmek yerine, modeli neden değiştirmiyoruz. Verilerin değiştirilmesi sonuçları (orijinal modelin geçerli olduğu varsayımına dayanarak) saptırırken, aşırı değerleri düzenleyerek modeli değiştirmek sonuçları etkilemez.
Belki göz ardı ettiğim bir sorun var mı?