Rastgele Orman'da “düğüm boyutu” ne anlama gelir?


Yanıtlar:


24

Bir karar ağacı, eğitim setinin özyinelemeli bölümü ile çalışır. Her düğüm bir karar ağacının bir dizi ile ilişkilidir eğitim setinden veri noktaları:tnt

n_t her düğümün boyutudur

Parametreyi nodesizebazı rastgele orman paketlerinde bulabilirsiniz, örneğin R : Bu, minimum düğüm boyutunun üstündeki örnekte minimum düğüm boyutudur. Bu parametre, ağaçlarınızın derinliğini dolaylı olarak ayarlar.

nodesize R rastgele orman paketinden

Minimum terminal düğüm boyutu. Bu sayının daha büyük olması, daha küçük ağaçların yetişmesine neden olur (ve bu nedenle daha az zaman alır). Varsayılan değerlerin sınıflandırma (1) ve regresyon (5) için farklı olduğuna dikkat edin.

Diğer paketlerde parametreyi doğrudan bulabilirsiniz depth, örneğin WEKA :

-depth WEKA rastgele orman paketinden

Ağaçların maksimum derinliği, sınırsız için 0. (varsayılan 0)


1
'Kayıtlar' nedir? Veri noktaları mı demek istediniz? Neden her düğüm bir kayıt kümesiyle ilişkilendirilir? Rastgele ormanları çok iyi anlıyorum, ama jargonun ne anlama geldiğini bilmiyorum.
wolfsatthedoor

Evet, demek istediğim veri noktası. Genellikle veri noktalarına kayıtlar, örnekler veya örnekler olarak atıfta bulunabilirsiniz.
Simone

Peki, ağaçlara aşırı sığmayı önlemek için minimum düğüm boyutu için bir kural var mı? Bunun veri setinin büyüklüğüne bağlı olduğunu düşünebilirim, bu yüzden belki de veri setinin belli bir oranı?
Seanosapien

1
Rasgele ormanlarda, ağaçlar tamamen büyür: düğüm boyutu 1'dir. Karar ağacında daha zor. Ağaçlar tam olarak büyümüş değildir ve aşırı sığmayı önlemek için budama yapmanız gerekir.
Simone

1
Winnowing, ağacı basitleştirmek ve aşırı sığmayı önlemek için bir tür özellik seçimi gibi görünüyor. Sanırım tek bir ağacı budamak her zaman faydalıdır. Bunun yerine, winnowing bazen doğruluğu azaltabilir, ancak ağacı basitleştirir.
Simone

2

Düğüm boyutunun "torba içi" örneklemede veya "torba dışı" hatası üzerinde olup olmadığı net değildir. "Torba dışı" örneklemedeyse, biraz daha kısıtlayıcıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.