Kabaca söylemek gerekirse, tek bir ağaçta meydana gelebilecek potansiyel aşırı uydurmanın bir kısmı (budama yapmanın bir nedeni budur) Rastgele Ormandaki iki şeyle hafifletilir:
- Bireysel ağaçları eğitmek için kullanılan örneklerin "önyükleme" olması.
- Rastgele özellikler kullanan çok sayıda rastgele ağaçlara sahip olmanız ve böylece bireysel ağaçlar güçlüdür, ancak birbirleriyle çok ilişkili değildir.
Düzenleme: OP'nin aşağıdaki yorumuna dayanarak:
Kesinlikle aşırı uydurma potansiyeli var. Makalelere gelince, Breiman tarafından "torbalama" ve genel olarak Efron ve Tibshirani tarafından "önyükleme" motivasyonunu okuyabilirsiniz. Brieman 2'ye kadar, ağaç gücü ve bireysel sınıflandırıcıların anti-korelasyonu ile ilgili genelleme hatasına gevşek bir bağ oluşturdu. Kimse sınırı kullanmaz (büyük olasılıkla), ancak topluluk yöntemlerinde düşük genelleme hatasına neyin yardımcı olduğuna dair sezgiler vermek içindir. Bu Rastgele Ormanlar gazetesinin kendisindedir. Benim görevim, bu okumalara ve tecrübelerime / çıkarımlara dayanarak sizi doğru yönde itmekti.
- Breiman, L., Torbalama Tahmin Cihazları, Makine Öğrenmesi, 24 (2), s.123-140, 1996.
- Efron, B .; Tibshirani, R. (1993). Önyükleme için açıklama. Boca Raton, FL
- Breiman, Leo (2001). "Rastgele Ormanlar". Makine Öğrenimi 45 (1): 5-32.