Hangi torbalama algoritmaları Random Forest'ın ardıllarına layık?


14

Algoritmaları artırmak için, oldukça iyi geliştiklerini söyleyebilirim. 1995'in başlarında AdaBoost tanıtıldı, bir süre sonra Gradient Boosting Machine (GBM) oldu. Son zamanlarda, doğru, aşırı uyumu ele alan ve birden fazla Kaggle yarışmasının galibi haline gelen XGBoost 2015 civarında piyasaya sürüldü. 2017 yılında LightGBM Microsoft tarafından tanıtıldı, XGBoost'a kıyasla önemli ölçüde daha düşük bir eğitim süresi sunuyor. Ayrıca, CatBoost, kategorik özellikleri ele almak için Yandex tarafından tanıtıldı.

Rastgele Orman 2000'li yılların başında tanıtıldı, ancak buna layık bir halef var mı? Rastgele Ormandan daha iyi bir torbalama algoritması mevcut olsaydı (pratikte kolayca uygulanabilir) Kaggle gibi yerlerde biraz dikkat çekerdi. Ayrıca, neden destekleme daha popüler topluluk tekniği haline geldi, çünkü en uygun tahmin için daha az ağaç oluşturabiliyor musunuz?


1
adaBoost aslında 1995 yılında tanıtıldı, ancak bu temel tezinizi değiştirmeyen küçük bir nokta.
jbowman

3
Rastgele ormanlardan bu yana, son derece rastgele ağaçların tanıtımını da gördük , ancak bu rastgele ormanların herhangi bir tutarlılıktan daha iyi performans gösterdiğine dair iyi bir kanıtın gerçekten farkında değilim, bu yüzden "layık" halef olmayabilirler ...
Jake Westfall

1
BART ( arxiv.org/abs/0806.3286 ), tek ağaç Bayesian CART'tan evrimleşen ve klasik topluluk yöntemlerinden esinlenen bir Bayes modelidir. Keşfetmeye değer.
Zen

zayıf öğrenme teknikleri ile birçok sorunu başarılı bir şekilde ele aldığı için güçlendirme daha popüler hale geldi
Refael

Düzenli açgözlü ormanlar, serin yan etkileri için bahsetmeye değer (yavaş ama bazı iyi sonuçlar) ve kantil rastgele ormanlar.
Michael M

Yanıtlar:


3

xgboost, catboost ve lightgbm rastgele ormanın bazı özelliklerini kullanır (değişkenlerin / gözlemlerin rasgele örneklenmesi), bu yüzden birlikte yükseltme ve RF'nin ardılı olduklarını ve her ikisinden de en iyi şeyleri aldıklarını düşünüyorum. ;)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.