SVM kullanırken, bir çekirdek seçmemiz gerekir.
Nasıl bir çekirdek seçileceğini merak ediyorum. Çekirdek seçiminde herhangi bir kriter var mı?
SVM kullanırken, bir çekirdek seçmemiz gerekir.
Nasıl bir çekirdek seçileceğini merak ediyorum. Çekirdek seçiminde herhangi bir kriter var mı?
Yanıtlar:
Çekirdek etkili bir benzerlik ölçütüdür, bu nedenle Robin (+1) tarafından önerilen önceki değişimlere göre çekirdeği seçmek iyi bir fikirdir.
Uzman bilgisinin yokluğunda, Radyal Temel İşlev çekirdeği iyi bir varsayılan çekirdek yapar (bir kez kurduktan sonra doğrusal olmayan bir model gerektiren bir problemdir).
Çekirdek ve çekirdek / normalleştirme parametrelerinin seçimi, çapraz değerleme temelli bir model seçiminin optimize edilmesiyle otomatikleştirilebilir (veya yarıçapı sınırını veya aralık sınırlarını kullanın). Yapılması gereken en basit şey, gradyan hesaplaması gerektirmeyen ve makul sayıda hiper parametresi için iyi çalışan Nelder-Mead simplex yöntemini kullanarak sürekli bir model seçim kriterini en aza indirmektir. Ayarlamak için birkaç hiper parametreniz varsa, otomatik model seçiminin, model seçim kriterinin farklılığından dolayı aşırı fazla uyuşmaya neden olması muhtemeldir. Gradyan tabanlı optimizasyon kullanmak mümkündür, ancak performans kazancı genellikle onu kodlama çabasına değmez).
Otomatik çekirdek seçimi ve çekirdek / normalleştirme parametreleri zor bir sorundur, çünkü model seçim kriterini (tipik olarak çapraz onaylama temelli) yenmek çok kolaydır ve başladığınızdan daha kötü bir modelle sonuçlanabilir. Otomatik model seçimi ayrıca performans değerlendirmesini de önleyebilir, bu nedenle performans değerlendirmenizin modele uygun tüm süreci değerlendirdiğinden emin olun (eğitim ve model seçimi), bkz.
GC Cawley ve NLC Talbot, Hiper parametrelerin Bayesian düzenlenmesi yoluyla model seçiminde aşırı uyumu önleme, Makine Öğrenimi Araştırma Dergisi, cilt 8, sayfa 841-861, Nisan 2007. (pdf)
ve
GC Cawley ve NLC Talbot, Model seçiminde aşırı uydurma ve performans değerlendirmesinde sonraki seçim önyargısı, Makine Öğrenimi Araştırma Dergisi, vol. 11, s. 2079-2107, Temmuz 2010. (pdf)
Neyin en iyi olacağından emin değilseniz, otomatik seçim tekniklerini kullanabilirsiniz (örneğin, çapraz doğrulama, ...). Bu durumda , farklı çekirdekten elde edilen (eğer sizin probleminiz sınıflandırma ise) sınıflandırıcı kombinasyonunu bile kullanabilirsiniz .
Bununla birlikte , bir çekirdekle çalışmanın "avantajı", normal "Öklid" geometrisini kendi probleminize uyacak şekilde değiştirmenizdir. Ayrıca, probleminize çekirdeğin ilgisini ve probleminizin geometrisine özgü olanı gerçekten anlamaya çalışmalısınız . Bu şunları içerebilir:
Doğrusal bir ayırıcının iyi olacağını biliyorsanız, afinite işlevlerini veren Çekirdeği kullanabilirsiniz (yani ). Düzgün KNN ruhunda pürüzsüz sınırların çok daha iyi olacağını düşünüyorsanız, o zaman bir Gauss çekirdeği alabilirsiniz ...
Her zaman SVM'ler için herhangi bir hiper parametre seçiminin ızgara arama ile birlikte çapraz doğrulama ile yapıldığı hissine kapılıyorum.
Genel olarak, RBF çekirdeği makul bir seçimdir. Dahası, doğrusal çekirdek, RBF'nin özel bir durumudur, Özellikle, özelliklerin sayısı çok fazla olduğunda, yalnızca doğrusal çekirdeği kullanabilirsiniz.