SVM'ler = Şablon Eşleştirme nasıl?


10

SVM'leri okudum ve bir optimizasyon problemi çözdüklerini ve maksimum marj fikrinin çok makul olduğunu öğrendim.

Şimdi, çekirdekleri kullanarak, doğrusal olmayan ayırma sınırlarını bile bulabilirler ki bu harikaydı.

Şimdiye kadar, SVM'lerin (özel bir çekirdek makinesi) ve çekirdek makinelerinin sinir ağlarıyla nasıl ilişkili olduğu hakkında hiçbir fikrim yok mu?

Yorumlarına düşünün Yann Lecun => burada :

kernel methods were a form of glorified template matching

ve burada da :

Örneğin, bazı insanlar onunla birlikte gelen sevimli matematik nedeniyle çekirdek yöntemleri ile göz kamaştırdı. Ancak, geçmişte söylediğim gibi, sonunda çekirdek makineleri “yüceltilmiş şablon eşleştirmesi” yapan sığ ağlardır. Bununla ilgili yanlış bir şey yok (SVM harika bir yöntemdir), ancak hepimizin bilmemiz gereken korkunç sınırlamaları vardır.

Yani sorularım:

  1. SVM sinir ağı ile nasıl ilişkilidir? Sığ bir ağ nasıl?
  2. SVM, iyi tanımlanmış bir objektif işlevle bir optimizasyon problemini çözer, şablon eşleştirme nasıl yapılır? Burada bir girdinin eşleştirildiği şablon nedir?

Bu yorumların yüksek boyutlu uzayları, sinir ağlarını ve çekirdek makinelerini tam olarak anlaması gerektiğini düşünüyorum, ancak şimdiye kadar denedim ve arkasındaki mantığı kavrayamadım. Ancak iki çok farklı ml tekniği arasındaki bağlantıları not etmek kesinlikle ilginçtir.

EDIT: Bence SVM'leri Sinirsel bir perspektiften anlamak harika olurdu. Hem doğrusal SVM hem de çekirdek hile ile SVM'lerde SVM'ler ve Sinir Ağları arasındaki bağlantıyı gerçekten anlamak için yukarıdaki iki soruya kapsamlı bir matematik destekli cevap arıyorum.


SVM'ler uygun bir çekirdek göz önüne alındığında eğitilmesi oldukça kolay ve hızlıdır. Bazı görevlerin derin sinir ağına ihtiyacı yoktur.
Vladislavs Dovgalecs

@xeon merhaba, cevaba bakabilir misin, sanırım iyileştirilmesi gerekiyor. Teşekkürler.
Rafael

Yanıtlar:


7
  1. SVM sinir ağı ile nasıl ilişkilidir? Sığ bir ağ nasıl?

SVM, kayıp fonksiyonu ve sadece doğrusal aktivasyon olarak menteşe kaybına sahip tek katmanlı bir sinir ağıdır. Konsept daha önceki iş parçacıklarında bu şekilde ifade edilmiştir: RelU aktivasyonu SVM'ye eşit olan tek katmanlı NeuralNetwork

  1. SVM, iyi tanımlanmış bir objektif işlevle bir optimizasyon problemini çözer, şablon eşleştirme nasıl yapılır? Burada bir girdinin eşleştirildiği şablon nedir?

Gram Matrisi (isterseniz Çekirdek Matrisi) benzerliğin bir ölçüsüdür. SVM seyrek çözümlere izin verdiğinden, tahmin örneğinizi şablonlarla, yani destek vektörleriyle karşılaştırma meselesi haline gelir.


cevap için teşekkürler, lütfen biraz daha matematik ile biraz daha açıklayınız. Bu gerçekten harika olur :)
Rafael

Şablon eşleştirme şeyini az çok anlıyorum, ancak ifadeyi alamadım: SVM seyrek çözümlere izin verdiği için ... seyrek çözümlerin burada bir şey yapması gereken şey nedir? Tanıma göre tahmin, şablonlarla ağır bir benzerlikle yapılır, bu nedenle sparititenin nereden geldiğini anlamıyorum. Ayrıca, menteşe kaybı etkinleştirme fonksiyonu ile ilgili birkaç satır ekleyin. Çok teşekkürler :)
Rafael
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.