SVM Algoritmasında w vektörü neden ayırıcı hiper düzlemle dikeydir?


13

Makine Öğrenimine yeni başladım. Olarak SVM, ayırıcı hiper tanımlanır y=wTx+b . Neden vektör söylemek w ayıran hiperdüzleme dik?


3
Benzer bir sorunun cevabı (sinir ağları için) burada .
bogatron

@bogatron - Sana tamamen katılıyorum. Ama benimkiler sadece SVM'ye özel bir cevap.
untitledprogrammer

2
Dışında değil. Cevabınız doğrudur, ancak SVM'lere özgü hiçbir şey yoktur (veya olmamalıdır). wTx=b basitçe bir hiper düzlemi tanımlayan bir vektör denklemidir.
bogatron

Yanıtlar:


10

Geometrik olarak, ağırlık vektör tarafından tanımlanan doğrunun dik yönlendirilir . Bu, aşağıdaki şekilde anlaşılabilir:wTx=b

İlk önce . Şimdi açık bir şekilde w ile iç çarpışan tüm vektörlerin ( x) bu denklemi, yani w ile dik olan tüm vektörlerin bu denklemi karşıladığı açıktır .b=0xw

Şimdi hiper düzlemi bir a vektörü üzerinde başlangıç ​​noktasından çevirin. Uçak için denklem haline gelir: , yani Ofset için bulmak b = bir T w vektör izdüşümüdür, a vektör üzerine ağırlık .(xa)Tw=0b=aTwaw

Genelliği kaybetmeden, düzleme dik bir şekilde seçebiliriz, bu durumda uzunluk bu, başlangıç ​​noktası ve hiper düzlem arasındaki en kısa, dikey mesafeyi temsil eder.||a||=|b|/||w||

Bu nedenle vektörünün ayırıcı hiper düzlem ile dik olduğu söylenir.w


5

Nedeni biz böyle olmak tanımlamak çünkü hiper düzlemine normaldir geçerli:w

3B alanda (hiper) bir düzlemimiz olduğunu varsayalım. Let , yani bu düzlemde bir noktası P 0 = x 0 , y 0 , z 0 . Bu nedenle başlangıç ​​noktasından ( 0 , 0 , 0 ) bu noktaya kadar olan vektör sadece < x 0 , y 0 , z 0 > ' dır . Düzlemde keyfi bir P ( x , y , z ) noktamız olduğunu varsayalım . P katılmadan vektörP0P0=x0,y0,z0(0,0,0)<x0,y0,z0>P(x,y,z)Pve daha sonra şu şekilde verilir: P - P 0 = < x - x 0 , y - y 0 , z - z 0 > Bu vektörün düzlemde olduğunu unutmayın.P0

PP0=<xx0,yy0,zz0>

Şimdi izin n düzlemine dik (ortogonal) vektörü olsun. Bu yüzden: n( P - p 0 ) = 0 yüzden: np - Np 0 = 0 Not olduğu - Np 0 sadece bir sayıdır ve eşittir b bölgesindeki bizim davamız, oysa n adildir w ve Pn^

n^(PP0)=0
n^Pn^P0=0
n^P0bn^wPxw

2

wTx+b=0xaxb

wTxa+b=0wTxb+b=0

wT.(xaxb)=0xaxbxbxawT.(xaxb)wTxaxb


0

Hiper düzlemle dikey olan bir vektörün cebirsel tanımını kullanarak:

 x1,x2 ayırma köprüsü üzerinde,

wT(x1-x2)=(wTx1+b)-(wTx2+b)=0-0=0 .
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.