Bir denge skoru tahmin etmeye çalıştım ve birkaç farklı regresyon yöntemini denedim. Fark ettiğim bir şey, tahmin edilen değerlerin bir çeşit üst sınıra sahip olduğu görünüyor. Yani, gerçek denge , ancak tahminlerim yaklaşık . Aşağıdaki grafik, gerçek ile tahmin edilen dengeyi göstermektedir (doğrusal regresyon ile tahmin edilir):
Ve aynı verilerin iki dağıtım grafiği:
Tahmincilerim çok eğik olduğundan (güç yasası dağıtımına sahip kullanıcı verileri), sonuçları aşağıdaki şekilde değiştiren bir Box-Cox dönüşümü uyguladım:
Tahminlerin dağılımını değiştirmesine rağmen, hala bu üst sınır var. Yani sorularım:
- Tahmin sonuçlarında bu tür üst sınırların olası nedenleri nelerdir?
- Tahminleri, gerçek değerlerin dağılımına karşılık gelecek şekilde nasıl düzeltebilirim?
Bonus: Box-Cox dönüşümünden sonraki dağılım, dönüştürülmüş tahmin edicilerin dağılımlarını takip ettiğinden, bunun doğrudan bağlantılı olması mümkün müdür? Eğer öyleyse, dağılımı gerçek değerlere uydurmak için uygulayabileceğim bir dönüşüm var mı?
Düzenleme: 5 öngörücü ile basit bir doğrusal regresyon kullandım.