GBM'de n.minobsinnode parametresinin R'deki rolü [kapalı]


21

GBM paketinde n.minobsinnode parametresinin ne anlama geldiğini bilmek istedim . Kılavuzu okudum, ama ne yaptığı belli değil. Sonuçları iyileştirmek için bu sayı küçük mü yoksa büyük mü olmalı?


9
"Bu sorunun gelecekteki ziyaretçilere yardım etmesi pek olası değildir". Gelecekteki bir ziyaretçiyim ve yararlı buldum.
Pisi

1
Ayrıca yararlı buldum.
oaxacamatt

Yanıtlar:


25

GBM algoritmasının her adımında yeni bir karar ağacı oluşturulur. Bir karar ağacı yetiştirilirken soru 'ne zaman durmalı?' Gidebileceğiniz en uzak nokta, her bir terminal düğümünde sadece 1 gözlem olana kadar her düğümü bölmektir. Bu n.minobsinnode = 1'e karşılık gelir. Alternatif olarak, her bir düğümde belirli sayıda gözlem olduğunda düğümlerin bölünmesi durdurulabilir. R GBM paketi için varsayılan değer 10'dur.

Kullanılacak en iyi değer nedir? Veri kümesine ve sınıflandırma veya regresyon yapıp yapmadığınıza bağlıdır. Her ağacın tahmini, terminal düğümdeki tüm girdilerin bağımlı değişkeninin ortalaması olarak alındığından, 1 değeri muhtemelen regresyon (!) İçin çok iyi çalışmaz, ancak sınıflandırma için uygun olabilir.

Daha yüksek değerler daha küçük ağaçlar anlamına gelir, bu nedenle algoritmanın daha hızlı çalışmasını sağlayın ve daha az bellek kullanın, bu da dikkate alınabilir.

Genel olarak, sonuçlar bu parametreye çok duyarlı değildir ve GBM performansının stokastik doğası göz önüne alındığında, tam olarak hangi değerin 'en iyi' olduğunu belirlemek zor olabilir. Etkileşim derinliği, büzülme ve ağaç sayısı genel olarak çok daha önemli olacaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.