Yalnız bu öngörücüyü modele yerleştiriyorsanız, öngörücü ile yanıt arasındaki oran oranı, üssel regresyon katsayısına tam olarak eşit olacaktır . Sitede bu sonucun türetildiğini sanmıyorum, bu yüzden bunu sağlamak için bu fırsatı değerlendireceğim.
Bir ikili sonuç ve tek ikili öngörücü düşünün :YX
X=1X=0Y=1p11p01Y=0p10p00
Daha sonra, arasındaki oran oranını hesaplamak için bir yol ve olduğuXiYi
OR=p11p00p01p10
Koşullu olasılık tanımı ile . Oranda, olduğu marjinal olasılıklar iptal edilir ve olasılık oranını koşullu olasılıkları açısından yeniden yazabilirsiniz :pij=P(Y=i|X=j)⋅P(X=j)XY|X
OR=P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
Lojistik regresyonda, bu olasılıkları doğrudan modellersiniz:
log(P(Yi=1|Xi)P(Yi=0|Xi))=β0+β1Xi
Böylece bu koşullu olasılıkları doğrudan modelden hesaplayabiliriz. Yukarıdaki ifadesindeki ilk oran :OR
P(Yi=1|Xi=1)P(Yi=0|Xi=1)=(11+e−(β0+β1))(e−(β0+β1)1+e−(β0+β1))=1e−(β0+β1)=e(β0+β1)
ve ikincisi:
P(Yi=0|Xi=0)P(Yi=1|Xi=0)=(e−β01+e−β0)(11+e−β0)=e−β0
bunu tekrar formüle .OR=e(β0+β1)⋅e−β0=eβ1
Not: Başka öngörücüleriniz olduğunda, onlara , üstel regresyon katsayısı (benzer bir türev kullanarak) aslındaZ1,...,Zp
P(Y=1|X=1,Z1,...,Zp)P(Y=0|X=1,Z1,...,Zp)⋅P(Y=0|X=0,Z1,...,Zp)P(Y=1|X=0,Z1,...,Zp)
dolayısıyla modeldeki diğer öngörücülerin değerlerine bağlı olan ve genel olarak eşit olmayan oran oranıdır .
P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
Dolayısıyla, katlanan katsayı ile gözlenen olasılık oranı arasında bir tutarsızlık gözlemlemeniz şaşırtıcı değildir.
Not 2: Gerçek ve gerçek olasılık oranı arasında bir ilişki türettim, ancak aynı ilişkinin örnek miktarlar için geçerli olduğunu unutmayın, çünkü tek bir ikili öngörücü ile donatılmış lojistik regresyon tam olarak iki-iki girişini çoğaltacaktır. tablo. Yani, takılan araçlar, herhangi bir GLM'de olduğu gibi numune araçlarıyla tam olarak eşleşir. Dolayısıyla, yukarıda kullanılan tüm mantık, örnek miktarları ile değiştirilen gerçek değerlerle uygulanır. β