Genellikle karar doğrusal veya bir RBF (aka Gaussian) çekirdeği kullanılıp kullanılmayacağıdır. Dikkate alınması gereken iki ana faktör vardır:
- Doğrusal bir çekirdek için optimizasyon problemini çözmek çok daha hızlıdır, bkz. Örneğin LIBLINEAR.
- Tipik olarak, mümkün olan en iyi prediktif performans, doğrusal olmayan bir çekirdek için (veya en azından doğrusal olanın kadar iyidir) daha iyidir.
O gösterilir oldu doğrusal çekirdek RBF bir dejenere versiyonu dolayısıyla doğrusal çekirdek asla daha doğru düzgün ayarlanmış RBF kernel daha. Bağladığım kağıttan soyut alıntı:
Analiz ayrıca, Gaussian çekirdeği kullanılarak tam model seçimi yapıldığında doğrusal SVM düşünülmesine gerek olmadığını göstermektedir.
Temel bir kural, NTU'nun vektör sınıflamasını desteklemek için pratik rehberinde kısaca ele alınmıştır (Ek C).
Özelliklerin sayısı büyükse, verileri daha yüksek boyutlu bir alana eşlemeniz gerekmeyebilir. Yani, doğrusal olmayan haritalama performansı iyileştirmez. Doğrusal çekirdeği kullanmak yeterince iyidir ve biri yalnızca C parametresini arar.
Sonuca varmak, az ya da çok doğru, ancak geriye doğru bir argüman var. Uygulamada, lineer çekirdek, özelliklerin sayısı büyük olduğunda çok iyi performans gösterme eğilimindedir (örneğin daha yüksek boyutlu bir özellik alanına eşlemenize gerek yoktur). Bunun tipik bir örneği, giriş alanında binlerce boyutta olan belge sınıflandırmasıdır.
Bu durumlarda, doğrusal olmayan çekirdekleri mutlaka doğrusal olandan önemli ölçüde daha kesin değildir. Bu temelde doğrusal olmayan çekirdeğin çekiciliğini yitirdiği anlamına gelir: öngörücü performansta çok az kazançlı ya da hiç olmayan bir şekilde eğitmek için daha fazla kaynağa ihtiyaç duyarlar, neden rahatsız ediyorlar.
TL; DR
Her zaman ilk önce doğrusal deneyin, çünkü eğitmek çok daha hızlıdır (AND testi). Doğruluk yeterliyse, başarılı bir iş yapmak için kendinizi arkaya yaslayın ve bir sonraki soruna geçin. Değilse, doğrusal olmayan bir çekirdeği deneyin.