Lojistik regresyonda log dönüşümlü yordayıcıların yorumlanması


16

Lojistik modelimdeki yordayıcılardan biri günlük dönüşüme uğradı. Günlük dönüşümü öngörücüsünün tahmini katsayısını nasıl değerlendiriyorsunuz ve bu öngörücünün olasılık oranı üzerindeki etkisini nasıl hesaplıyorsunuz?


Ayrıca ilginizi çekebilir
Makro

1
Bu sorunun çok açık ve kapsamlı bir tedavisi, jthetzel'in stats.stackexchange.com/questions/18480/…
rolando2

Yardımların için teşekkür ederim. Daha fazla açıklama. Aslında log tabanı 2-'ye dönüştüğümde, daha önceki cevaba göre , öngörücüde iki katına çıkmanın sonuçta% balta değişikliğine yol açması sezgisel bir anlam ifade eder .
mp77

Yanıtlar:


16

Tahmini katsayıyı üslerseniz , öngörücüde kat artışıyla ilişkilib bir oran oranı elde edersiniz , buradab , öngörücüyü günlüğe dönüştürürken kullandığınız logaritmanın tabanıdır.

Bu durumda genellikle logaritmaları baz 2'ye almayı tercih ederim, bu nedenle üstel katsayıyı , tahmin edicinin iki katına çıkma ile ilişkili bir oran oranı olarak arayabilirim .


3
İlginç. Her zaman doğal günlükler kullanırım çünkü katsayıların çoğu sıfıra yakın olma eğilimindedir ve daha sonra oransal (göreceli) farklar olarak yorumlanabilir. Diğer logaritma bazlarında bu mümkün değildir. Diğer üsleri kullanmanın birtakım değerini görüyorum, ancak cevabınızı netleştirmeniz gerektiğini düşünüyorum, çünkü prima facie yorumunuz katsayının değerini hiç kullanmıyor!
whuber

@whuber prima facie ne anlama geliyor? İlk yüz ??
onestop


@whuber aşağıdaki soruya cevabımda, bu günlüğe log-log dönüştürülmüş regresyonların olağan mantığını uygulayarak yorumunuzu resmileştirmeye çalıştım, ayrıca karşılaştırmak için k-katlı yorumlamayı resmileştirdim. Bir log-log regresyonunda log-dönüştürülmüş değişken üzerindeki katsayının üssel hale getirilmesi her zaman size k-katlı yorumlama sağlar - bu lojistik duruma özgü değildir. Ancak lojistik durumda muhtemelen üstel yapacağız, belki de bu yüzden fikir burada daha doğal bir şekilde ortaya çıkıyor?
Richard DiSalvo

8

Eğer bu durumda @gung tamamen doğru, ancak do tutmaya karar Eğer katsayı her üzerinde bir etkiye sahip olan yorumlayabilir, birden her yerine, IV ek IV.

Sıklıkla dönüştürülmesi gereken bir IV gelirdir. Dönüştürülmemiş olarak eklediyseniz, her biri (diyelim) , gelirdeki 1000 dolarlık bir artış, oran oranıyla belirtilen oranlar üzerinde etkili olacaktır. Öte yandan, eğer günlük (10) gelir aldıysanız, gelirdeki her 10 kat artışın, oran oranında belirtilen oranlar üzerinde etkisi olacaktır.

Gelir için bunu yapmak mantıklıdır, çünkü birçok yönden gelirde 1.000 dolarlık bir artış, yılda 10.000 dolar kazanan biri için çok daha büyüktür. $ 100,000.

Son bir not - lojistik regresyon hiçbir normallik varsayımı yapmasa da, OLS regresyonu bile değişkenler hakkında varsayımlar yapmaz, artıklar tarafından tahmin edildiği gibi hata hakkında varsayımlar yapar.


1
+1, iyi puan. Sanırım daha eksiksiz olabilirdim. Ayrıca, dolar işaretlerinden hemen önce ters eğik çizgi "\" koyarak yanlışlıkla mathjax'ı kapattım. Umarım umursamazsın.
gung - Monica'yı eski durumuna döndürün

'Lojistik regresyon hataları hakkında varsayım yapar' ile ne demek istiyorsun?

Hayır, OLS regresyonu hatalar hakkında varsayımlar yapar. Bahsettiğim buydu.
Peter Flom - Monica'yı eski durumuna döndürün

3

Bu cevap Fred L. Ramsey ve Daniel W. Schafer tarafından İstatistiksel Sleuth'dan uyarlanmıştır.

Model denkleminiz:

log(p/(1p))=β0+βlog(X)

Daha sonra, X'teki her bir kat artışı , oranların bir çarpma faktörü k β ile değişmesiyle ilişkilidir .kXkβ

Örneğin, hastanede kalış süresinde gerileyen yatak yaralarının varlığı için aşağıdaki modele sahibim.

log(oddsofbedsore)=.44+0.45(lengthofstay)

Yani benim .β=0.45

Modelinizin yorumlanabilirliği için en uygun olanı temel alarak herhangi bir seçebilirsiniz .k

Ben karar ve aşağıdakileri elde:k=2

kβ=20.45=1.37

k=2Kalış süresinin ), yatak yatma oranının 1.37 oranında değişmesi ile ilişkilidir. Ya da kalış süremi iki katına çıkarırsanız, bir yatak yarası alma şansım% 137 olacaktır.

k=0.5

kβ=0.50.45=0.73

k=0.5


bu, model denkleminizin sol tarafında kullanılan günlüğün sağ tarafta kullanılan günlükle aynı olmasını gerektirir mi? bir logit regresyon günlük üssü için sol tarafta günlük varsayılan olacağını düşünüyorum, bu yüzden k olarak değiştirilmesi gerekir?
Richard DiSalvo

0

Genel model

ln(p/(1p))=β0+βlogk(x)

kek=ek

k=eβxβ sonucun oran artış yüzdesi." Detaylar takip eder.

Model

ln(p/(1p))=β0+βln(x)

ln()

βx

odds(x)=p(x)/(1p(x))ln(odd(x))=β0+βln(x)x1x2=1.01×x1

odds(x2)/odds(x1)=(x2/x1)β=(1.01)β1+β×0.01

|β|küçük olmak.

xββ=0.05β×0.01=0.0005 ve dolayısıyla x'te% 1'lik bir artış, sonucun 1 olma olasılığında% 0,05'lik bir artışa yol açar (yani, bu oranlar 1.0005 ile çarpılır).

Bu argüman, bağımsız değişken için kullanılan logaritmanın tabanına, logit dönüşümündeki log olasılık oranı için kullanılan tabanla aynıdır. Hemen hemen her zaman logit dönüşümü için kullanılan baz doğal log olduğundan, bu argüman bağımsız değişkeni dönüştürmek için doğal log kullanmaya dayanır. (Birisi logit dönüşümü için farklı bir taban kullanan değiştirilmiş bir logit regresyonu yapacak olsaydı, aynı argümanın tutacağı anlaşılıyor, ama bunun konvansiyon olduğunu düşünmüyorum.)

keβkkee

Model

ln(p/(1p))=β0+βlogk(x)

ln()logk() log tabanı k'dir. Bağımlı değişkenin logit dönüşümünün doğal günlüğü kullanmaya devam ettiğine dikkat edin.

odds(x)=p(x)/(1p(x))

odds(logk(x)+1)/odds(logk(x))=eβ

eβeβ=1.10

1=logk(k)

odds(logk(x)+logk(k))/odds(logk(x))=eβ

Böylece

odds(logk(kx))/odds(logk(x))=eβ

x

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.