"Nümerik" özelliklerden bahsettiğinizden beri, özelliklerinizin kategorik olmadığını ve yüksek bir ariteye sahip olduklarını düşünüyorum (çok fazla farklı değer alabilirler ve bu nedenle birçok olası bölünme noktası vardır). Böyle bir durumda, ağaçların yetiştirilmesi zordur, çünkü değerlendirmek için [birçok özellik birçok bölünmüş nokta vardır].×
Benim tahminim, en büyük etkinin XGBoost'un bölünme noktalarında yaklaşık bir değer kullanması gerçeğinden kaynaklanıyor. 10000 olası bölmeyle sürekli bir özelliğiniz varsa, XGBoost varsayılan olarak yalnızca "en iyi" 300 bölmeyi dikkate alır (bu bir basitleştirmedir). Bu davranış sketch_eps
parametre tarafından kontrol edilir ve onunla ilgili daha fazla bilgiyi dokümanda okuyabilirsiniz . Düşürmeyi deneyebilir ve yaptığı farkı kontrol edebilirsiniz. Scikit-learn belgelerinde bundan söz edilmediği için , sanırım mevcut değil. XGBoost yönteminin kağıtlarında ne olduğunu öğrenebilirsiniz (arxiv) .
XGBoost ayrıca bu bölünmüş noktaların değerlendirilmesinde bir yaklaşım kullanır. Hangi ölçüt bilim dalının öğrendiğini bölücülerin değerlendirdiğini bilmiyorum, ama zaman farkının kalanını açıklayabilir.
Adres Yorumları
Bölünmüş puanların değerlendirilmesi ile ilgili olarak
Ancak, "XGBoost ayrıca bu bölünmüş puanların değerlendirilmesinde bir yaklaşım kullanıyor" derken ne demek istediniz? Anladığım kadarıyla, değerlendirme için makalede, (7) 'de göründüğü gibi, optimal amaç fonksiyonunda tam bir azaltma kullanıyorlar.
noktasını değerlendirmek için, yi hesaplamanız gerekir; burada , maliyet fonksiyonudur ; hedef, , , şimdiye kadar oluşturulan model ve Geçerli ekleme . Bunun XGBoost'un yaptığı şey olmadığına dikkat edin; Onlar hesaplamak için çok basit bir fonksiyona yol açan bir Taylor Expansion tarafından maliyet fonksiyonunu basitleştiriyorlar . göre Gradient ve nin Hessian'ını hesaplamaları gerekir ve bu sayıyı, aşamasındaki tüm potansiyel bölmeler için tekrar kullanabilirler , bu da aşırı hesaplamayı hızlandırır. Kontrol edebilirsinL(y,Hi−1+hi)LyHi−1hiLLHi−1iKayıp fonksiyonu Yaklaşım ve daha fazla ayrıntı için Taylor Genişlemesi (CrossValidated Q / A) ile veya kağıtlarındaki türevlendirme.
Mesele şu ki verimli bir şekilde yaklaştırmanın bir yolunu . tamamen değerlendirmek durumundaysanız , optimizasyon veya kaçınma veya yedekli hesaplamaya izin veren içeriden bilgi sahibi olmadan, bölünme başına daha fazla zaman alacaktır. Bu konuda, bir yaklaşımdır. Bununla birlikte, diğer gradyan arttırma uygulamaları da bölünmeleri değerlendirmek için bir vekil maliyet fonksiyonlarını kullanmaktadır ve XGBoost yaklaşımının bu konuda diğerlerinden daha hızlı olup olmadığını bilmiyorum.L(y,Hi−1+hi)L