Yanıtlar:
Lojistik regresyon her şeyden önce regresyondur. Bir karar kuralı ekleyerek bir sınıflandırıcı olur. Geriye doğru giden bir örnek vereceğim. Yani, veri almak ve bir model yerleştirmek yerine, bunun gerçekten bir gerileme problemi olduğunu göstermek için modelle başlayacağım.
Lojistik regresyonda, sürekli bir miktar olan bir olayın meydana geldiği log oranlarını veya logit'i modelleyiyoruz. olayının gerçekleşme olasılığı P ( A ) ise, olasılıklar:
Günlük olasılıkları şöyledir:
Doğrusal regresyonda olduğu gibi, bunu doğrusal bir katsayı ve öngörücü kombinasyonu ile modelliyoruz:
Bir kişinin gri saçları olup olmadığına dair bir model verildiğini düşünün. Modelimiz tek öngörücü olarak yaşı kullanır. Burada, olayımız A = bir kişinin gri saçları var:
gri saçların günlük oranları = -10 + 0.25 * yaş
... Regresyon! İşte bazı Python kodu ve bir çizim:
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
x = np.linspace(0, 100, 100)
def log_odds(x):
return -10 + .25 * x
plt.plot(x, log_odds(x))
plt.xlabel("age")
plt.ylabel("log odds of gray hair")
İşte kod:
plt.plot(x, 1 / (1 + np.exp(-log_odds(x))))
plt.xlabel("age")
plt.ylabel("probability of gray hair")
Lojistik regresyon, daha gerçekçi örneklerde de sınıflandırıcı olarak harika çalışır, ancak bir sınıflandırıcı olmadan önce, bir regresyon tekniği olmalıdır!
Kısa cevap
Evet, lojistik regresyon bir regresyon algoritmasıdır ve sürekli bir sonucu öngörür: bir olayın olasılığı. Bunu ikili bir sınıflandırıcı olarak kullandığımız sonucun yorumlanmasından kaynaklanmaktadır.
detay
Lojistik regresyon bir tür genelleştirilmiş doğrusal regresyon modelidir.
Sıradan bir doğrusal regresyon modelinde, sürekli bir sonuç, y
öngörücülerin ürünü ve etkilerinin toplamı olarak modellenir:
y = b_0 + b_1 * x_1 + b_2 * x_2 + ... b_n * x_n + e
e
hata nerede .
Genelleştirilmiş doğrusal modeller y
doğrudan modellemez . Bunun yerine, alan adını y
tüm gerçek sayılara genişletmek için dönüşümleri kullanırlar . Bu dönüşüme link fonksiyonu denir. Lojistik regresyon için link fonksiyonu logit fonksiyonudur (genellikle aşağıdaki nota bakınız).
Logit işlevi şu şekilde tanımlanır:
ln(y/(1 + y))
Dolayısıyla lojistik regresyon şekli:
ln(y/(1 + y)) = b_0 + b_1 * x_1 + b_2 * x_2 + ... b_n * x_n + e
y
bir olayın olasılığı nerede .
Bunu ikili bir sınıflandırıcı olarak kullanmamız, sonucun yorumlanmasından kaynaklanmaktadır.
Not: probit, lojistik regresyon için kullanılan başka bir bağlantı fonksiyonudur, ancak logit en yaygın kullanılanıdır.
Tartışırken regresyonun tanımı sürekli bir değişkeni öngörüyor. Lojistik regresyon ikili bir sınıflandırıcıdır. Lojistik regresyon, olağan regresyon yaklaşımının çıktısına bir logit fonksiyonunun uygulanmasıdır. Logit işlevi (-inf, + inf) değerini [0,1] olarak değiştirir. Bence sadece tarihi nedenlerden dolayı bu isim saklanıyor.
"Görüntüleri sınıflandırmak için biraz gerileme yaptım. Özellikle lojistik regresyon kullandım." Hata.