HighBandwidth öğesinin önerdiği gibi, doğrusal bir SVM mi yoksa doğrusal olmayan bir tane mi kullandığınıza bağlıdır (çekirdek kullanılmıyorsa bilgiç olma, bir SVM yerine maksimum marj doğrusal sınıflandırıcıdır).
Maksimum kenar boşluğu doğrusal sınıflandırıcısı, diğer tüm doğrusal sınıflandırıcılardan farklı değildir, çünkü veri oluşturma işlemi öznitelikler arasında etkileşimler olduğu anlamına gelirse, bu etkileşim terimlerinin sağlanması performansı artıracaktır. Maksimal marj doğrusal sınıflandırıcısı, sırt regresyonuna benzer, aşırı takılmayı önlemek için tasarlanan ceza süresinde (regülasyon parametresi için uygun değerler verilir) küçük bir fark vardır ve çoğu durumda sırt regresyonu ve maksimum marj sınıflandırıcısı benzer performans verecektir.
O etkileşim terimleri önemli olması muhtemeldir düşünüyorsanız, o zaman polinom çekirdek kullanarak bir SVM özelliği uzaya bunları tanıtabilirsiniz , hangi her eksenin veya daha küçük bir monomiali temsil ettiği bir özellik alanı verecektir , parametresi farklı siparişlerin monomiyallerinin nispi ağırlıklandırmasını etkiler. Dolayısıyla, polinom çekirdeği olan bir SVM, bu etkileşimleri dolaylı olarak içeren nitelik alanına bir polinom modelinin yerleştirilmesine eşdeğerdir. d cK(x,x′)=(x⋅x′+c)ddc
Yeterince özellikleri göz önüne alındığında, herhangi bir doğrusal sınıflandırıcı olabilir trivially verileri uygun. Bir boyutlu uzayda "genel pozisyonda" IIRC an noktaları bir hiper-düzlem (cf VC boyutu) ile parçalanabilir (herhangi bir şekilde ayrılabilir). Bunu yapmak genellikle aşırı fazla oturmaya neden olur ve bundan kaçınılmalıdır. Maksimal marj sınıflandırmasının amacı, mümkün olan en büyük ayrımı (yanlış sınıflandırma üretmek için herhangi bir eğitim örneğinden en büyük sapmayı gerektirecek) anlamına gelen bir ceza terimi ekleyerek bu aşırı uyumu sınırlamaktır. Bu, çok fazla fazla bağlantıya maruz kalmadan verileri çok yüksek boyutlu bir alana (doğrusal bir modelin çok güçlü olduğu) dönüştürebileceğiniz anlamına gelir.n - 1nn−1
Bazı çekirdeklerin "önemsiz" bir sınıflandırmanın genel konumdaki herhangi bir sonlu eğitim örneği için mümkün olduğu garanti edilen sonsuz boyutlu bir özellik alanı yarattığını unutmayın. Örneğin, radyal temel işlev çekirdeği, ; burada özellik alanı sonsuz boyutlu bir hiper kürenin pozitif ortezidir. Bu tür çekirdekler SVM'yi esasen herhangi bir karar sınırını temsil edebilen evrensel bir tahminci yapar .K(x,x′)=exp−γ∥x−x′∥2
Ancak bu hikayenin sadece bir parçası. Uygulamada, genellikle kenar boşluğunun ihlal edilmesine izin verilen yumuşak kenarlı bir SVM kullanıyoruz ve marjı maksimuma çıkarmak (yani, kullanılan cezaya benzer bir ceza terimi olan) arasında bir dengeleme parametresi var. sırt regresyonu) ve gevşek değişkenlerin büyüklüğü (eğitim örneğindeki kayba benzer). Daha sonra, regresyon parametresini ayarlayarak, örneğin sırt regresyonu durumunda yaptığımız gibi, çapraz doğrulama hatasını (veya bir-dışarıda bırakma hatasına bağlı olan) en aza indirerek aşırı uydurmaktan kaçınırız.
SVM Yani ederken olabilir trivially eğitim seti sınıflandırmak düzenliliği ve çekirdek parametreleri kötü şekilde seçildiği takdirde, genellikle sadece bunu yapacağız. Herhangi bir çekirdek modeli ile iyi sonuçlar elde etmenin anahtarı, uygun bir çekirdek seçmektir ve daha sonra verilerin aşırı veya eksik oturmasını önlemek için çekirdek ve düzen parametrelerini ayarlamaktır.