SVM'de hiper düzlemden uzaklığı yorumlama


14

SVM'leri sezgisel olarak anlama konusunda birkaç şüphem var. SVMLight veya LibSVM gibi standart bir araç kullanarak sınıflandırma için bir SVM modeli geliştirdiğimizi varsayalım.

  1. Test verilerini tahmin etmek için bu modeli kullandığımızda, model her test noktası için "alfa" değerlerine sahip bir dosya oluşturur. Alfa değeri pozitifse, test noktası Sınıf 1'e aittir, aksi takdirde Sınıf 2'ye aittir. Şimdi, daha yüksek "alfa" değerine sahip bir test noktasının "daha yüksek" olasılıkla ilgili sınıfa ait olduğunu söyleyebilir miyiz?

  2. İlk soruya benzer şekilde, bir SVM eğitimli olduğumuzda. SV'ler hiper-düzleme çok yakın. Yani bu SV'ların yüksek olasılıkla o sınıfa ait olduğu anlamına mı geliyor? Bir sınıfa ait bir noktanın olasılığını "hiper düzlem" den uzaklığıyla ilişkilendirebilir miyiz? "Alfa" değeri "hiper düzlem" e olan mesafeyi temsil ediyor mu?

Giriş için teşekkürler.


Cevabın "hayır" olduğunu düşünüyorum, ancak SVM'lere tam bir cevap vermek için yeterli değilim. Benim cevabım, Berlin Duvarı'nın Doğu yakasında olduğunuzda, ne kadar uzak olursanız olun, sadece yanlış taraftasınız.
Arthur

scikits.learn sahiptir predict_proba SVC ve linear_model.SGDClassifier için, sadece ikili sınıflandırıcılar için inanıyoruz; Yine de kullanmadım.
denis

Yanıtlar:


18

iyiw,xib22w22wp(w|(y1,x1),...,(ym,xm))1/Zexp(w22)iexp(yiw,xib22)wZnormalleştiğinden emin olur). Gauss olasılığını, işaretini çevirerek ve üslandırarak kayıp fonksiyonundan elde edersiniz. Ancak bunu SVM'nin kayıp fonksiyonu ile yaparsanız, log olabilirliği normalleştirilebilir olasılıklı bir model değildir.

SVM'yi bir hale getirme girişimleri vardır. Libsvm de uygulanan -sence bence- en dikkate değer olanı:

John Platt: Destek Vektör Makineleri için Olasılık Çıktıları ve Düzenlenmiş Olabilirlik Yöntemleriyle Karşılaştırma (NIPS 1999): http://www.cs.colorado.edu/~mozer/Teaching/syllabi/6622/papers/Platt1999.pdf

Sorunuzu daha açık bir şekilde cevaplamak için: SVM'lerin fikri gerçekten de bir test vektörü hiper düzlemden ne kadar uzaksa, belirli bir sınıfa o kadar çok ait olmasıdır (elbette yanlış tarafta olması hariç). Bu anlamda, destek vektörleri yüksek olasılıklı sınıfa ait değildir, çünkü bunlar ya hiper düzlemin en yakın ya da yanlış tarafında olanlardır. Eğer LIBSVM aldığım bu değer ile ilgisi yoktur karar fonksiyonunda. Daha ziyade karar fonksiyonunun çıktısı (ve bu nedenle düzgün olarak olarak adlandırılmalıdır ). Yana buradaααiSVαik(x,xi)+byy=iSVαik(x,xi)+b=w,ϕ(x)H+bw üreyen çekirdek Hilbert uzayında yaşıyor, hiper düzlemle işaretli mesafe ile orantılı. Eğer norm bölün eğer olurdu çekirdek açısından ise, .ywwH=i,jSVαiαjk(xi,xj)


Açıklamanız için teşekkürler ... makaleyi okuyacak
Amit
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.