Bence bu basit bir soru, ancak neden ya da neden olmasın ardındaki mantık olmayabilir. Sormamın nedeni, yakın zamanda bir RF uygulamamı yazdım ve iyi performans göstermesine rağmen beklediğim kadar iyi performans göstermiyor ( Kaggle Fotoğraf Kalitesi Tahmin yarışması veri setine, kazanan puanlara ve bazılarına dayanarak) hangi tekniklerin kullanıldığı hakkında mevcut olan sonraki bilgiler).
Bu gibi durumlarda yaptığım ilk şey modelim için çizim tahmin hatasıdır, bu nedenle verilen her tahmin değeri için ortalama önyargı (veya sapma) doğru hedef değerden uzağa belirlerim. Benim RF için bu arsa var:
Bunun RF için yaygın olarak gözlenen bir önyargı deseni olup olmadığını merak ediyorum (eğer değilse, belki de veri setine ve / veya uygulamama özgü bir şey olabilir). Elbette bu çizimi önyargıyı telafi etmek için kullanarak tahminleri iyileştirmek için kullanabilirim, ancak RF modelinin kendisinde ele alınması gereken daha temel bir hata veya eksiklik olup olmadığını merak ediyorum. Teşekkür ederim.
== EK ==
İlk araştırmam bu blog girişinde Rastgele Orman Yanlılığı - Güncelleme