Neden her zaman topluluk öğrenmesini kullanmıyorsunuz?


13

Bana öyle geliyor ki, topluluk öğrenimi her zaman tek bir öğrenme hipotezinden daha iyi tahmin performansı verecek.

Peki, neden onları sürekli kullanmıyoruz?

Benim tahminim belki hesaplama sınırlamaları yüzünden mi? (o zaman bile zayıf tahmin ediciler kullanıyoruz, bu yüzden bilmiyorum).


2
Çünkü topluluk öğrenme her zaman daha iyi performans vermez. Hem torbalama hem de artırma bazı durumlarda çalışır, ancak diğerlerinde performansı ciddi şekilde düşürebilir.
Marc Claesen

Yanıtlar:


12

Genel olarak her zaman daha iyi performans göstereceği doğru değildir. Her birinin kendine özgü avantajları / zayıflıkları olan birkaç topluluk yöntemi vardır. Hangisini kullanmak ve daha sonra eldeki soruna bağlıdır.

Örneğin, yüksek değişkenliğe sahip modelleriniz varsa (verilerinize fazla uyuyorsa), torbalamayı kullanmaktan muhtemelen faydalanabilirsiniz. Önyargılı modelleriniz varsa, bunları Boosting ile birlikte kullanmak daha iyidir. Toplulukları oluşturmak için farklı stratejiler de vardır. Konu tek bir cevapta ele alınamayacak kadar geniştir.

Ama benim açımdan: Bunu ayarı için yanlış topluluk yöntemi kullanırsanız, vardır değil daha iyi yapacağını. Örneğin, Torbalı'yı taraflı bir modelle kullanmak yardımcı olmaz.

Ayrıca, olasılıklı bir ortamda çalışmanız gerekiyorsa, topluluk yöntemleri de çalışmayabilir. O olduğu bilinen (AdaBoost gibi, en popüler formlarında) Arttırılması zayıf olasılık tahminleri sağladığını. Yani, sadece sınıflandırma değil, verileriniz hakkında akıl yürütmenize izin veren bir modele sahip olmak istiyorsanız, grafik bir modelle daha iyi olabilirsiniz.


Karar kütüğü önyargılıdır, ancak torbalama ile başarıyla kullanılmıştır.

evet, ama topluluk hala önyargılı. Önyargı gerçekten bir sorunsa? Torbalama düzeltmeye yardımcı olmaz. Bahsettiğiniz davaya bir referans ekleyebilir misiniz?
jpmuc
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.