Lojistik Regresyon, neden Lojistik Sınıflandırma olarak adlandırılmıyor?


75

Yana Lojistik Regresyon istatistiksel edilir sınıflandırma modeli kategorik bağımlı değişkenler ile uğraşan, neden çağrılmaz Lojistik Sınıflandırması ? Sürekli bağımlı değişkenlerle uğraşan modellere "Regresyon" adı verilmeli midir?


5
Lojistik regresyon, GLM model ailesine aittir.
Stéphane Laurent

10
Olasılıkları gerilemek için kullanabilirsiniz.
Emre,

25
Lojistik regresyon kesinlikle getirdiği olasılıklar üzerine bir eşik getirerek sınıflandırma için kullanılabilirken, tek kullanım alanı - hatta birincil kullanımı bile zor. Sınıflandırma ile ilgisi olmayan regresyon amaçları için geliştirilmiştir ve kullanılmaya devam edilmektedir. Bunun hala çoğunlukla ne için kullanıldığını kolayca savunuyorum, ama sanırım neye baktığınıza bağlı.
Glen_b

6
Sen bulabilir bu gazeteyi bunun bir regresyon tekniği olarak kullanılmaktadır sorunların türlü anlam katmak yapar, özellikle beri ilginç lojistik regresyon gelişimi üzerinde.
Glen_b

Yanıtlar:


102

Lojistik regresyon kesinlikle kendi başına bir sınıflandırma algoritması değildir . Bu, sonucun öngörülen olasılıklarını iki yönlü yapan bir karar kuralıyla birlikte bir sınıflandırma algoritmasıdır . Lojistik regresyon , bir regresyon modelidir, çünkü sınıf üyeliğinin, özelliklerin (a) dönüşümü çok işlevli bir fonksiyonu olarak tahmin edilme olasılığını tahmin eder.

Frank Harrell , bu web sitesinde bir sınıflandırma algoritması olarak lojistik regresyonla ilgili tuzakları sıralayan bir dizi cevap yayınlamıştır. Onların arasında:

Doğru hatırlıyorsam, bir keresinde beni bu (ve daha fazlası!) Noktalarında daha fazla ayrıntılandırmak için regresyon stratejileri üzerine kitabına işaret etti, ancak o belirli yazıyı bulamıyorum.


1
Durum buysa, sınıflayıcıların tümü (ya da çoğu) ilk önce (bildiğim kadarıyla) bir sınıfa dahil olma olasılıklarını tahmin eder ve sonra bu probu sınıflara dönüştürürler.
Outlier

9
@Outlier Counterexample: SVM, sınıf olasılıklarını hiç hesaplamaz, sadece bir gözlem ile bir hiper uçak arasındaki mesafeyi ölçer.
Sycorax

ML'deki @Olier, bunlara olasılık sınıflandırıcıları denir; ağaçlar ve rastgele ormanlar değildir, xgboost - en azından logloss ile)
seanv507

12

E[Y|X=x]

  • (Y | X = x) normal dağılım gösterdiğini varsayarsak klasik regresyon ile verim.
  • Poisson dağılımının varsayılması, Poisson regresyonuna yol açar.
  • Bir Bernoulli dağılımının varsayılması, lojistik regresyon sağlar.

(Y|X=x)


-3

Hali hazırda temin iyi cevaplardan, başka bir görünüm (ki lojistik regresyon olasılıkların öngörür olmasıdır sürekli değer ) var olduğunu aralığı 0 ile 1 arasında.

görüntü tanımını buraya girin

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.