Bu soruyu yayınlanmış kanıtlar, kişisel deneyimler ve spekülasyonların bir kombinasyonu ile cevaplamaya çalışacağım.
A) Yayınlanmış kanıtlar.
Soruyu cevaplamaya yardımcı olduğunu bildiğim tek makale Delgado et al 2014 - Gerçek Dünya Sınıflandırma Sorunlarını Çözmek için Yüzlerce Sınıflandırıcıya İhtiyacımız Var mı? - UCI için 121 veri kümesinde yüzlerce farklı algoritma ve uygulama yürüten JMLR . Her ne kadar RBF SVM "en iyi" algoritma olmasa da (doğru hatırlıyorsam rastgele ormanlar), ilk 3 (veya 5) arasında olduğunu buluyorlar.
Veri kümesi seçiminin gerçek dünya sorunlarının "iyi bir örneği" olduğunu düşünüyorsanız, SVM kesinlikle yeni problemler üzerinde denenmesi gereken bir algoritmadır, ancak önce rastgele ormanı denemelisiniz!
Bu sonucun genelleştirilmesindeki sınırlar, veri kümelerinin çok seyrek değil, neredeyse tüm uzun ve sıska (n >> p) olmasıdır - ki tahmin ediyorum ki RF için daha büyük bir sorun olmalı ve çok büyük değil (n ve p).
Son olarak, hala yayınlanan kanıtlar üzerinde, rastgele ormanların farklı uygulamalarını karşılaştıran iki site öneriyorum:
B) Kişisel deneyim.
Delgado et gibi kağıtların makine öğrenimi topluluğu için çok önemli olduğuna inanıyorum , bu yüzden sonuçlarını farklı koşullar altında tekrarlamaya çalıştım. 100'den fazla ikili veri setinde (Delgado'nun veri setlerinden) 15 farklı algoritma çalıştırdım. Ben de onlar sonra hiperparametrelerin seçiminde daha dikkatli olduğunu düşünüyorum.
Benim sonuçlarım SVM "en iyi algoritma" (ortalama sıra 4.9) oldu. Benim aldığım şey, SVM'nin RF'yi geçtiğidir, çünkü orijinal veri kümesi spekülasyon bölümünde tartışacağım çok sınıflı problemler içeriyordu - SVM için bir sorun olmalı.
DÜZENLEME (Haziran / 16):
Ama RF olan yolu yol daha hızlı ve GBM (5.8), ardından 2 iyi algoritma (ortalama rank 5.6), nnets (7.2) ve diğerleri) içeren oldu. Bu problemlerde standart lojistik regresyonu denemedim, ama elastik bir ağ (L1 ve L2 düzenli LR) denedim ama iyi performans göstermedi (ortalama sıralama 8.3) ~
Sonuçları analiz etmeyi veya makaleyi yazmayı henüz bitirmedim, sonuçlarla teknik bir rapora bile işaret edemiyorum. Umarım, birkaç hafta içinde bu cevabı yeniden düzenleyebilir ve sonuçları içeren teknik bir rapora işaret edebilirim.
Makale http://arxiv.org/abs/1606.00930 adresinde mevcuttur. Tam analizden sonra RF ve SVM'nin beklenen hata oranı açısından neredeyse eşdeğer olduğu ve SVM'nin en hızlı olduğu ortaya çıkmaktadır (sürprizime göre !!). Artık RF'yi (hız zeminlerinde) önermeye o kadar da vurgu yapmıyorum.
Kişisel deneyimim, SVM size biraz daha fazla doğruluk kazandırabilir, ancak bir RF kullanmak neredeyse her zaman daha iyi bir seçimdir.
Ayrıca daha büyük sorunlar için, toplu SVM çözücüsünü kullanmak imkansız olabilir ( LASVM veya diğerleri gibi çevrimiçi bir SVM çözücüsünü hiç kullanmadım ).
Sonunda sadece bir durumda lojistik regresyon kullandım. Bir görüntü sınıflandırma problemi üzerinde bazı "yoğun" özellik mühendisliği yapıyordum (örneğin, görüntünün iki farklı tanımını ve açıklamaların boyutsallığını birleştirin ya da birleştirmeyin). Ve birçok alternatif arasından seçim yapmak için lojistik regresyon kullandım (çünkü LR'de hiperparametre araması yok). En iyi özelliklere (LR'ye göre) yerleştikten sonra, son sınıflandırıcıyı elde etmek için bir RF (en iyi hiperparametreler için seçim) kullandık.
C) Spekülasyon
Hiçbir zaman çok sınıflı problemler üzerinde ciddi bir şekilde çalışmadım, ama benim hissim SVM'nin bu kadar iyi olmadığı. Sorun, bire-bir ya da bire-tüm çözümler arasındaki sorun değil, bildiğim tüm uygulamaların tüm (OVO veya OVA) sınıflandırıcılar için aynı hiperparametreleri kullanması. SVM için doğru hiperparametreleri seçmek o kadar pahalıdır ki, bildiğim raflı uygulamaların hiçbiri her sınıflandırıcı için bir arama yapmayacaktır. Bunun SVM için bir sorun olduğunu düşünüyoruz (ancak RF için bir sorun değil!).
Sonra tekrar, çoklu sınıf problemleri için doğrudan RF'ye giderdim.