TB, AIDS vb. Gibi yıkıcı hastalıkların hastaneye yatış harcamalarını ne kadar iyi etkilediğini tahmin etmek için bir model çalıştırmaya çalışıyorum. Neredeyse hepsi cinsiyet, hanehalkı durumu başkanı, yoksulluk durumu ve tabii ki hastalığınız olup olmadığı için bir kukla olan bağımsız değişkenler olarak bağımlı değişken olarak "hastaneye yatış maliyetine" ve çeşitli bireysel belirteçlere sahibim. ve yaş kare) ve bir grup etkileşim terimi.
Bekleneceği gibi, önemli miktarda - ve yani çok fazla - sıfırda yığılmış veri vardır (yani, 12 aylık referans döneminde hastaneye yatış masrafı yoktur). Bu gibi verilerle başa çıkmanın en iyi yolu nedir?
Şu andan itibaren maliyeti ln(1+cost)
tüm gözlemleri içerecek şekilde dönüştürmeye ve sonra doğrusal bir model çalıştırmaya karar verdim . Ben doğru yolda mıyım?