İki veri kümenizin özelliği doğrusal ayrılabilirliktir , basitçe, onları ayıran bir çizgi olmasıdır. Birçok makine öğrenimi, ilgilendiğiniz ayrılığı gerçekleştiren çizgiler olan doğrusal sınıflandırıcılar bulmaya adanmıştır .
Çizgiler hakkında konuşurken, puanlarınızın düzlemde olduğunu varsayacağım. Yapmak istediğiniz şey , w 2 ve w 3 değerlerini bulmaktır , öyle ki A kümesindeki tüm noktalar ( a 1 , a 2 ) , w 1 a 1 + w 2 a 2 ≥ w 3 ve tüm noktalar ( b 1 , b 2 ) içinde B , w 1 b 1 +w1w2w3(a1,a2)Aw1a1+w2a2≥w3(b1,b2)B . Bu nedenle, eşitsizlik w 1 x + W 2 y ≥ w 3 grubu bir sınıflandırıcı olarak görülebilir A .w1b1+w2b2<w3w1x+w2y≥w3A
Optimal çizgiyi (doğrusal regresyon, lojistik regresyon vb.) Belirlemek için çok sayıda makine öğrenme algoritması vardır. Bunlar bazı hata ölçülerine dayalı olarak değerlerini bulur . Ardından tüm noktaların doğru sınıflandırılıp sınıflandırılmadığını test edebilirsiniz. Yani, A'daki tüm değerlerin yukarıdaki denklemi ve benzer şekilde B'yi karşılayıp karşılamadığı .w1,w2,w3AB
Sadece böyle bir çizginin var olup olmadığıyla ilgilendiğiniz için, mevcut teknikleri kullanmanız gerekiyordu (ancak bu muhtemelen daha basit olurdu). Sadece serbest değişkenleri açısından aşağıdaki eşitlik koleksiyonunu ayarlayın .w1,w2,w3
her biri için i = 1 , . . , | A | Nerede bir = { ( a 1 1 , bir 1 2 ) , ... , ( a | A |w1ai1+w2ai2≥w3i=1,..,|A|.A={(a11,a12),…,(a|A|1,a|A|2)}
her biri için j = 1 , . . , | B | burada B = { ( b 1 1 , b 1 2 ) , … , ( b | B | 1 , b | B | 2 ) } .w1bj1+w2bj2<w3j=1,..,|B|B={(b11,b12),…,(b|B|1,b|B|2)}
Bu kısıtlamalar tutarlıysa, bir çizgi vardır.