Lojistik regresyon ve destek vektör makineleri arasındaki fark nedir?


14

Lojistik regresyonun, eğitim örneklerini ayıran bir hiper düzlem bulduğunu biliyorum. Ayrıca destek vektör makinelerinin hiper düzlemi maksimum marjla bulduğunu da biliyorum.

Benim sorum: lojistik regresyon (LR) ve destek vektör makineleri (SVM) arasındaki fark, SVM hiper düzlemi maksimum marjla bulurken LR'nin eğitim örneklerini ayıran herhangi bir hiper düzlem bulması mı? Yoksa yanılıyor muyum?

Not: olduğunda lojistik fonksiyonunun verdiğini hatırlayın . Sınıflandırma eşiği olarak olduğunu varsayarsak , bir köprü veya bir karar sınırıdır.θx=00.50.5θx=0


Yanıtlar:


8

Sert SVM'den bahsediyorsanız haklısınız ve iki sınıf doğrusal olarak ayrılabilir. LR, iki sınıfı ayıran herhangi bir çözüm bulur. Sert SVM, maksimum marjı olan tüm olası çözümler arasında "" çözümünü bulur.

Yumuşak SVM ve sınıfların doğrusal olarak ayrılamaması durumunda, küçük bir değişiklikle hala haklısınız. Hata sıfır olamaz. LR, bazı hataların en aza indirilmesine karşılık gelen bir hiper düzlem bulur. Yumuşak SVM hatayı en aza indirmeye çalışır (başka bir hata) ve aynı zamanda bu hatayı bir normalleştirme parametresi aracılığıyla marjdan alır.

İkisi arasındaki bir fark: SVM sert bir sınıflandırıcıdır, ancak LR olasılıklıdır. SVM seyrek. İki sınıf arasında en ayrımcı güce sahip olan destek vektörlerini (eğitim örneklerinden) seçer. Test sırasında diğer eğitim noktalarını bunun ötesinde tutmadığından, iki sınıftan herhangi birinin dağılımı hakkında hiçbir fikrimiz yok.

İki sınıfın doğrusal olarak ayrılabilirliği durumunda LR çözümünün (IRLS kullanarak) nasıl kırıldığını ve böyle bir durumda neden olasılıksal bir sınıflandırıcı olmayı bıraktığını açıkladım: /stats//a/133292/66491


3
Lojistik regresyon ne tür en küçük kareler optimize eder? LR, çapraz entropiyi bir kayıp olarak kullanır .
Artem Sobolev

1
lojistik regresyonun en küçük kareler anlamına gelmeyen IRLS kullanması - IRLS'deki yeniden ağırlıklandırma, parametrelerin mevcut tahmininin bir fonksiyonudur ve gerçek fonksiyonun en küçük karelerden oldukça farklı olmasını sağlar.
Glen_b -Monica

özetlemek gerekirse, SVM LR'nin gelişmiş bir varyantıdır, çünkü LR sadece bir çeşit (rastgele konuşma?) hiper düzlem bulurken maksimum marjlı hiper düzlemi bulur. Bu özetlemeye katılıyor musunuz?
LandonZeKepitelOfGreytBritn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.