Lojistik regresyon tahminlerini anlama


13

Bir lojistik regresyon modelinden (R'de glm) gelen tahminlerim beklediğim gibi 0 ile 1 arasında sınırlı değil. Lojistik regresyon anlayışım, giriş ve model parametrelerinizin doğrusal olarak birleştirilmesi ve yanıtın logit link işlevi kullanılarak bir olasılığa dönüştürülmesidir. Logit işlevi 0 ile 1 arasında sınırlandığından, tahminlerimin 0 ile 1 arasında sınırlanmasını bekledim.

Ancak R'de lojistik regresyonu uygularken gördüğüm şey bu değil:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

resim açıklamasını buraya girin

Herhangi bir şey varsa tahmin (model) çıktı normal görünüyor bana. Aldığım değerlerin neden olasılık olmadığını kimse bana açıklayabilir mi?


3
Corone'un aşağıdaki cevabı detayları çok iyi kaplıyor. Yukarıdaki orijinal şekil, x ekseninde, matematiksel olarak olasılıklara dönüştürülebilen log-olasılık değerlerini sunar (örneğin, Corone'un cevabına göre, bağlantı işlevinden geri dönerek).
James Stanley

Yanıtlar:


16

predict.glmVarsayılan olarak yöntem lineer öngörücü ölçekte yordayıcılarını döndürür. Yani henüz link fonksiyonundan geçmediler.

Deneyin

hist(predict(model, type = "response"))

yerine

resim açıklamasını buraya girin


4
Kısa sürede biçimlendirme ve illüstrasyon yeteneklerimizde ustalaşarak harika bir iş çıkardınız: Bu cevap bunun güzel bir örneğidir. Aferin!
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.