Rasgele orman ağaçları için budama neden gerekli değildir?


20

Breiman, ağaçların budama olmadan büyüdüğünü söylüyor. Niye ya? Demek istediğim, rastgele ormandaki ağaçların budamamasının sağlam bir nedeni olmalı. Öte yandan, fazla oturmamak için tek bir karar ağacının budanması çok önemlidir. Bu nedenle okunabilecek bazı literatür var mı? Tabii ki ağaçlar birbiriyle ilişkili olmayabilir ancak yine de aşırı uyum olasılığı vardır.


Buradaki bağlam hakkında gerçekten daha fazla şey söylemeniz gerekiyor. @ChrisA. dikkate değer bir girişimde bulundu, ancak sorunuzun gerçekten yanıtlanıp yanıtlanmadığını bilmek zor, çünkü ocağınız hakkında çok şey bilmek zor.
gung - Monica'yı eski durumuna döndürün

2
Daha ne söylenmeli? Soru çok açık.
Seanosapien

Yanıtlar:


20

Kabaca söylemek gerekirse, tek bir ağaçta meydana gelebilecek potansiyel aşırı uydurmanın bir kısmı (budama yapmanın bir nedeni budur) Rastgele Ormandaki iki şeyle hafifletilir:

  1. Bireysel ağaçları eğitmek için kullanılan örneklerin "önyükleme" olması.
  2. Rastgele özellikler kullanan çok sayıda rastgele ağaçlara sahip olmanız ve böylece bireysel ağaçlar güçlüdür, ancak birbirleriyle çok ilişkili değildir.

Düzenleme: OP'nin aşağıdaki yorumuna dayanarak:

Kesinlikle aşırı uydurma potansiyeli var. Makalelere gelince, Breiman tarafından "torbalama" ve genel olarak Efron ve Tibshirani tarafından "önyükleme" motivasyonunu okuyabilirsiniz. Brieman 2'ye kadar, ağaç gücü ve bireysel sınıflandırıcıların anti-korelasyonu ile ilgili genelleme hatasına gevşek bir bağ oluşturdu. Kimse sınırı kullanmaz (büyük olasılıkla), ancak topluluk yöntemlerinde düşük genelleme hatasına neyin yardımcı olduğuna dair sezgiler vermek içindir. Bu Rastgele Ormanlar gazetesinin kendisindedir. Benim görevim, bu okumalara ve tecrübelerime / çıkarımlara dayanarak sizi doğru yönde itmekti.

  • Breiman, L., Torbalama Tahmin Cihazları, Makine Öğrenmesi, 24 (2), s.123-140, 1996.
  • Efron, B .; Tibshirani, R. (1993). Önyükleme için açıklama. Boca Raton, FL
  • Breiman, Leo (2001). "Rastgele Ormanlar". Makine Öğrenimi 45 (1): 5-32.

Ancak yine de aşırı sığdırma olasılığı olabilir. Bunun için bir makale okuyabilir misiniz?
Z Khan

@Z Khan Belki de bu Z Khan mısın? Öyleyse, hesaplarınızı birleştirebilmemiz için lütfen bize bildirin.
whuber

3
@ZKhan RF'lerde aşırı uyum sorunu Hastie ve diğerleri, (2009) İstatistiksel Öğrenme Unsurları, 2. Baskıda ele alınmıştır . Kitabın web sitesinde ücretsiz bir PDF bulunmaktadır. Rasgele ormanlarla ilgili bölüme göz atın.
Monica'yı eski durumuna getirin - G. Simpson
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.