Hiyerarşik lojistik regresyon için neden Bernoulli parametresinde beta dağıtımı kullanıyorsunuz?


13

Şu anda Kruschke'nin mükemmel "Bayesian Veri Analizi Yapıyor" kitabını okuyorum. Bununla birlikte, hiyerarşik lojistik regresyon (Bölüm 20) bölümü biraz kafa karıştırıcıdır.

Şekil 20.2, Bernoulli parametresinin bir sigmoid fonksiyon aracılığıyla dönüştürülen katsayılar üzerinde doğrusal bir fonksiyon olarak tanımlandığı hiyerarşik bir lojistik regresyonu tarif eder. Bu, çevrimiçi olarak diğer kaynaklarda da gördüğüm örneklerin çoğunda hiyerarşik lojistik regresyonun ortaya çıkış şekli gibi görünüyor. Örneğin - http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

Bununla birlikte, öngörücüler nominal olduğunda, hiyerarşiye bir katman ekler - Bernoulli parametresi şimdi mu ve kappa tarafından belirlenen parametrelerle bir beta dağılımından (Şekil 20.5) çekilir; burada mu, katsayıların doğrusal fonksiyonunun sigmoid dönüşümüdür ve kappa önceden bir gama kullanır.

Bu, bölüm 9'daki madeni para çevirme örneğine makul ve benzer görünüyor, ancak nominal tahmincilerin bir beta dağılımı eklemekle ne ilgisi olduğunu görmüyorum. Metrik öngörücüler için neden böyle bir şey yapılmasın ve nominal öngörücüler için beta dağılımı neden eklendi?

EDIT: Bahsettiğim modellerle ilgili açıklama. İlk olarak, metrik öngörücülere sahip bir lojistik regresyon modeli (daha önce beta yok). Bu, yukarıdaki hata örneği gibi diğer hiyerarşik lojistik regresyon örneklerine benzer:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

Sonra nominal öngörücüler ile örnek. Burada, hiyerarşinin "düşük" seviyesinin (lojistik sonucu bir binomdan önce bir betaya dahil etme) ve metrik örnekten neden farklı olması gerektiğini tam olarak anlamıyorum.

zben~Çöp Kutusu(θben,N-)θben~Beta(birj,bj)birj=μjκbj=(1-μj)κκ~Γ(Sκ,R,κ)μj=sig(β0+Σjβjxjben)β0~N-(M0,T0)βj~N-(0,τβ)τβ=1/σβ2σβ2~katlanmış t(Tt,DF)

Yanıtlar:


9

Karşılaştırdığınız iki modelin birçok yabancı özelliği var ve bence aşağıdaki iki basitleştirilmiş model bağlamında sorunuzu daha net bir şekilde ifade edebilirsiniz:

Model 1:

yben|μben~Bern(μben)μben~π(μben)

Model 2:

yben|θben~Bern(θben)θben|μben,κ~Beta(μbenκ,(1-μben)κ)μben~π(μben)

Sorularınız: (1) beta dağıtımının hangi rolü oynadığı; ve ilgili olarak, (2) Model 2'nin Model 1'den (eğer varsa) farkı nedir?

Yüzeyde bunlar oldukça farklı modeller gibi görünmektedir, ancak aslında her iki modeldeki marjinal dağılımları aynıdır. Model 1'deki posterior dağılımı ise, Model 2'deki marjinal arka dağılımı : μ i p ( μ i | y i ) μ y i i ( 1 - μ i ) 1 - y i π ( μ i ) μ iμbenμben

p(μben|yben)αμbenyben(1-μben)1-ybenπ(μben)
μben
p(μben|yben,κ)α01θbenyben+μbenκ-1(1-θben)κ(1-μben)-ybenB(κμben,κ(1-μben))dθπ(μben)αB(yben+μbenκ,1-yben+κ(1-μben))π(μben)B(κμben,κ(1-μben))αμbenyben(1-μben)1-ybenπ(μben)

Bu nedenle, Model 2'yi kullanmaktan kazanılan herhangi bir avantaj hesaplanabilir. Model 2'de eklenmesi gibi hiyerarşik modellerin aşırı parametrelendirilmesi bazen örnekleme prosedürünün verimliliğini artırabilir; örneğin, parametre grupları arasına koşullu eşlenik ilişkiler ekleyerek (bkz. Jack Tanner'ın cevabı) veya ilgili parametreler arasındaki korelasyonu kırarak (google "Parametre Genişletme").θben


5

Bernoulli parametresini bir beta dağılımından çekmenin nedeni, beta'nın binom ile eşlenik olmasıdır . Bir konjügatın önceden dağıtılması , kapalı formlu bir çözeltinin posterioru bulmasını sağlar.

EDIT: açıklayıcı. Her iki model de çalışır. MCMC ile bile, eşdeğer önceliklere sahip olmak yararlıdır çünkü bu, genel örnekleyicilere göre daha verimli olan çeşitli dağıtım türleri için özel örnekleyicilerin kullanımına izin verir. Örneğin, JAGS kullanım kılavuzuna bakın. 4.1.1 ve sn 4.2.


Benim sorum kitapta yeterli bağlam olmayabilir, ancak bu analizler Gibbs örneklemesi ile yapılır, bu yüzden posteriorun kapalı form gösterimi gerekli değildir. Bağladığım örnekte, bernoulli parametresi bir beta dağılımı olarak sabit değildir, ancak normal olarak dağıtılmış katsayıları olan lineer öngörücülerin sigmoid dönüşümünden kaynaklanır. Bu aynı zamanda Kruschke'nin bölümde daha önceki bir örneği (metrik öngörücülerle) nasıl sunacağıdır (bernoulli parametresi, normal olarak dağıtılmış katsayılarla lineer fonksiyonun sigmoid dönüşümüdür)
user4733

@ user4733 Jack Tanner, bernoulli numunelerinden önce beta'nın konjugat olduğu konusunda haklı. seçildiği bir tesadüfden daha fazlası gibi görünüyor. Evet, posterior dağılımı elde etmek için Gibbs örneklemesi yapıyor olabilirsiniz, ancak hiyerarşik bir modelde, daha önce dahil olan birden fazla var ve bir hiperparametreye (önceki dağılımlar ailesinin bir parametresi) bir öncekini koyuyor olabilirsiniz. Bu bağlamda daha önce bir konjugat kullanmak uygun olabilir. Kitabın açıklamasının bir kısmı bizim için kafa karıştırıcı
Michael R. Chernick

1
Neler olup bittiğini anlama yeteneğimizde boşluklar yaratan küçük alıntılar yapıyorsunuz.
Yardımcı

Önerdiğim hiyerarşik modellere bazı açıklamalar eklendi. Umarım yardımcı olur.
user4733 17:12
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.