Lojistik regresyon doğrusal bir kombinasyon olarak tanımlanabilir
η=β0+β1X1+...+βkXk
bağlantı fonksiyonundan geçirilir :g
g(E(Y))=η
Burada link işlevi bir logit işlevidir
E(Y|X,β)=p=logit−1(η)
burada yalnızca içindeki değerleri alır ve ters logit fonksiyonları doğrusal kombinasyonu değerini bu aralığa dönüştürür. Klasik lojistik regresyonu burada sona eriyor.Y{0,1}η
Bunu hatırlamak Ancak eğer tek değerler alan değişkenler için , daha olarak düşünülebilir . Bu durumda, logit fonksiyon çıktısı koşullu "başarı" olasılığı, yani olarak düşünülebilir . Bernoulli dağılımı bazı ikili sonucu gözleme olasılığını açıklayan bir dağıtım biz tarif böylece, parametre olarakE(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)P(Y=1|X,β)pY
yi∼Bernoulli(p)
Bu nedenle lojistik regresyon ile, bağımsız değişkenlere sahip ile doğrusal bir kombinasyon oluşturan bazı parametreler arıyoruz . Klasik regresyonda (bağlantı işlevinin kimlik işlevi olduğunu varsayarız), ancak içindeki değerleri alan modeline sığdırmak için dönüştürmemiz gerekir. içerisinde aralığında.βXηE(Y|X,β)=ηY{0,1}η[0,1]
Şimdi, bazı sabıkası pick up Bayes şekilde lojistik regresyon tahmin etmek lineer regresyon gibi parametreler (bkz Kruschke vd 2012 sonra doğrusal kombinasyonu dönüştürmek için logit işlevini kullanın) yüzden a olarak çıkış kullanmak, değişkeninizi tanımlayan Bernoulli dağılımının parametresi . Yani, evet, aslında denklemi ve logit link işlevini frekansçı durumdakiyle aynı şekilde kullanırsınız ve geri kalanı (örneğin, öncelikleri seçmek) Bayes yolunun lineer regresyonunu tahmin etmek gibi çalışır.βiηpY
Öncelikleri seçmek için basit yaklaşım, 'ler için ve parametreleri ile önceden ayarlanmış veya alınan Normal dağılımları (ancak - veya Laplace dağılımını daha sağlam model için de kullanabilirsiniz ) dan hiyerarşik priors . Şimdi, model tanımına sahip olarak, modeli tahmin etmeniz için Markov Chain Monte Carlo simülasyonunu gerçekleştirmek için JAGS gibi yazılımları kullanabilirsiniz . Aşağıda basit lojistik modeli için JAGS kodunu gönderiyorum ( daha fazla örnek için buraya bakın).tβiμiσ2i
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
Gördüğünüz gibi, kod doğrudan model tanımına dönüşür. Ne yazılım yapar için normal priors gelen bazı değerleri çizer olduğunu a
ve b
o zaman tahmin etmek bu değerleri kullanır p
ve son olarak, veri bu parametreleri verilmektedir nasıl olasılıkla değerlendirmek için olabilirlik fonksiyonunu kullanır (bu Bayes teoremi kullandığınızda, bkz olduğunu burada için daha ayrıntılı açıklama).
Temel lojistik regresyon modeli, hiyerarşik bir model ( hiperpriorlar dahil ) kullanarak öngörücüler arasındaki bağımlılığı modellemek için genişletilebilir . Bu durumda çizebilirsinizβi bağımsız değişkenler arasında kovaryans hakkında bilgi sağlayan Çok Değişkenli Normal dağılımından 'lerΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼MVN⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥,⎡⎣⎢⎢⎢⎢⎢σ20σ1,0⋮σk,0σ0,1σ21⋮σk,1……⋱…σ0,kσ1,k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
... ama bu ayrıntılara giriyor, o yüzden burada duralım.
Buradaki "Bayesci" kısım, Bayes teoremini kullanarak öncelikleri seçmek ve olasılık açısından terimleri tanımlamaktır. "Bayesci model" tanımı için buraya ve Bayesci yaklaşım hakkındaki bazı genel sezgi için buraya bakın . Ayrıca fark edebileceğiniz, modelleri tanımlamanın bu yaklaşımla oldukça basit ve esnek olmasıdır.
Kruschke, JK, Aguinis, H. ve Joo, H. (2012). Zamanı geldi: Örgütsel bilimlerde veri analizi için Bayesci yöntemler. Örgütsel Araştırma Yöntemleri, 15 (4), 722-752.
Gelman, A., Jakulin, A., Pittau, GM ve Su, Y.-S. (2008). Lojistik ve diğer regresyon modelleri için zayıf bilgilendirici bir varsayılan ön dağıtım. Yıllıklar Uygulamalı İstatistik, 2 (4), 1360-1383.