SVM'nin hala üstün olduğu uygulamalar var mı?


10

SVM algoritması oldukça eskidir - 1960'larda geliştirilmiştir, ancak 1990'larda ve 2000'lerde son derece popülerdi. Makine öğrenimi kurslarının klasik (ve oldukça güzel) bir parçasıdır.

Bugün medya işlemede (görüntüler, ses vb.) Sinir ağlarının tamamen baskın olduğu, diğer bölgelerde Gradient Boosting'in çok güçlü pozisyonları olduğu görülmektedir.

Ayrıca, son veri yarışmalarında hiçbir SVM tabanlı çözüm gözlemlemiyorum.

SVM'nin hala en son sonuçları veren uygulama örneklerini arıyorum (2016 itibariyle).

Güncelleme: SVM'yi açıklarken örn. Öğrencilere / meslektaşlara verebileceğim, sadece teorik veya itiraz edilmiş bir yaklaşım gibi görünmeyecek bir örnek almak istiyorum.


3
Hangi anlamda üstün? Bazı performans ölçütleri? Derin bir sinir ağı eğitimi önemli miktarda bilgisayar süresi gerektirir, ancak dizüstü bilgisayarımda servis edilebilir bir SVM eğitebilirim.
Sycorax, Reinstate Monica'yı

@ user777 Tabii ki uygulama alanına uygun sınıflandırma / regresyon metriğini kastediyorum. DL için hesaplama karmaşıklığı sorunu önemlidir, ancak bu biraz bu sorunun kapsamı dışındadır.
Alleo

Yanıtlar:


11

Makaleye göre Gerçek Dünya Sınıflandırma Problemlerini Çözmek için Yüzlerce Sınıflandırıcıya İhtiyacımız Var mı? Rastgele Orman ve Degrade Önyükleme Makineleri ile birlikte SVM, 120'den fazla büyük veri kümesi için (metrik olarak doğruluk kullanarak) en iyi performans gösteren sınıflandırma algoritmaları arasındadır.

Deneylerini bazı modifikasyonlarla tekrarladım ve bu üç sınıflandırıcının diğerlerinden daha iyi performans gösterdiğini, ancak ücretsiz öğle yemeği teoreminin belirtmediği gibi, diğer bazı algoritmaların bu üçten daha iyi performans gösterdiği her zaman bir sorun var.

Yani evet, SVM'nin (Gauss çekirdeği ile - kullandığım şey) hala medya ile ilgili olmayan veri kümeleri için ilgili bir algoritma olduğunu söyleyebilirim.


Merhaba, cevap için teşekkürler! Bu ilginç çalışmayı gördüm. Bildiğim kadarıyla anladığım kadarıyla, fikri (veri analisti ise herhangi bir ciddi ayar yapmadan verir ne kadar sınıflandırıcı görmekti gerektiğini IMO ayarlama yapmak). Alanla ilgili bir çalışma daha ilgi çekici olacaktır.
Alleo

1
Delgado ve hepsinin en iyi hiperparametreler için çok ayrıntılı bir arama yapmadığını, ancak biraz arama yaptılarsa hatırlıyorum. Soru (cevabım yok), en iyi hipeparametreler için daha ince taneli bir aramanın farklı sonuçlarla sonuçlanıp sonuçlanmayacağıdır. Bu doğruysa, SVM'ye rakip algoritmaların genel olarak belirli hiperparametrelerin doğruluğunda çok keskin bir zirveye sahip olduğu anlamına gelir, bu da algoritma için olumsuz bir faktör olduğunu düşünüyorum.
Jacques Wainer

Ayrıca küçük bir yorum, UCI veri kümelerinin (testler için kullanılır) çoğunlukla oldukça küçük olmasıdır. Acaba bu artışın kötü sonuçlarının açıklaması olabilir mi? Kaggle zorluklarının çoğu (çok fazla veri ile) GB'nin üstün performansını gösterir.
Alleo

Veri kümelerinin küçük olduğuna katılıyorum. Daha büyük veri kümeleri için şu anda Rastgele Ormanları kullanıyorum - hiperparametrelerden daha rahat olduğumda GBM'yi kullanmaya başlayacağım - Onlara GBM'nin ne kadar mantıklı olduğunu bilmiyorum.
Jacques Wainer
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.