Herkes konjugat öncelikleri mümkün olan en basit terimlerle açıklayabilir mi?


23

Bir süredir Bayesci istatistiklerde eşlenik öncelikler fikrini anlamaya çalışıyorum ama anlayamıyorum. Bu fikri belki de en basit terimlerle açıklayabilir, belki de "Gauss öncesi" yi örnek olarak kullanabilir miyiz?

Yanıtlar:


23

Bir parametrenin önceliği neredeyse her zaman belirli bir fonksiyonel forma sahip olacaktır (genellikle yoğunluk cinsinden yazılır). Diyelim ki kendimizi belirli bir dağıtım ailesiyle sınırlandırıyoruz, bu durumda önceden seçmemiz o ailenin parametrelerini seçmeye indirgeniyor.

Örneğin, normal bir modelini . Basit olması için, bilinen şekilde ele alalım . Modelin bu kısmı - veri modeli - olabilirlik fonksiyonunu belirler.σ 2YiiidN(μ,σ2)σ2

Bayesci modelimizi tamamlamak için burada .μ

Yukarıda belirtildiği gibi, yaygın olarak için önceliğimiz için bazı dağıtım ailesi belirtebiliriz ve daha sonra sadece bu dağıtımın parametrelerini seçmeliyiz (örneğin, genellikle önceki bilgiler oldukça belirsiz olabilir - kabaca olasılığın konsantre olmasını istediğimiz yerde olduğu gibi) - çok spesifik fonksiyonel formdan ziyade, parametreleri seçerek istediğimizi modellemek için yeterli özgürlüğe sahip olabiliriz - önceki bir ortalama ve varyansla eşleştiğini varsayalım).μ

Eğer bunun için arka çıkıyor dan aynı sonra, önceden olduğu gibi ailenin önceki is "eşlenik" olduğu söylenir söyledi.μ

(Konjuge olmasını sağlayan şey, olasılıkla bir araya gelme şeklidir)

Öyleyse bu durumda (örneğin ) için bir Gaussian alalım . Eğer bunu yaparsak, için posteriorun da Gausscu olduğunu görürüz . Sonuç olarak, Gauss öncesi, yukarıdaki modelimiz için önceki bir eşlenikti.μ N ( θ , τ 2 ) μμμN(θ,τ2)μ

Gerçekten hepsi bu kadar - posterior öncekiyle aynı aileden geliyorsa, daha önce bir eşlenik.

Basit durumlarda, olasılığın incelenmesi ile bir konjugatı tanımlayabilirsiniz. Örneğin, bir binom olasılığını düşünün; sabitleri bırakarak, bu bir beta yoğunluğu benziyor ; çünkü yolu yetkilerinin ve birleştirmek, bu çarpın bir beta tarafından önceden de yetkilerinin ürün elde edecek ve biz olasılığı o hemen görebilirsiniz ... beta binom olasılığından önce için bir konjugat olacaktır .p ( 1 - p ) p ( 1 - p ) ppp(1p)p(1p)p

Gauss davasında, log yoğunluklarını ve log olasılığını göz önünde bulundurarak bunun gerçekleşeceğini görmek en kolayıdır; log olabilirliği kuadratik olacaktır ve iki kuadratik toplamı kuadratiktir, bu nedenle kuadratik bir log-önceki + kuadratik log-olabilirliği kuadratik bir posterior verir (en yüksek derecedeki terim katsayılarının her biri elbette negatif olacaktır) .μ


9

Modeliniz üstel bir aileye aitse , yani dağıtımın yoğunluğu biçimindeyse bir göre verilen hakim ölçü (Lebesgue, sayma, ve Tc.), burada O anlamına gelir skalar fazla ürün ve ölçülebilir fonksiyonlar, konjugata önceki değerler vardır biçimi yoğunlukları ile tanımlanır [

f(x|θ)=h(x)exp{T(θ)S(x)ψ(θ)}xXθΘ
t s R d T : XR dtsRd
T:XRdS:ΘRd
θ
π(θ|ξ,λ)=C(ξ,λ)exp{T(θ)ξλψ(θ)}
d ν Θ C ( ξ , λ ) - 1 = Θ exp { T ( θ ) ξ - λisteğe bağlı olarak seçilmiş hakim ölçü üzerinde ile] ve ,dνΘ
C(ξ,λ)1=Θexp{T(θ)ξλψ(θ)}dν<
λΛR+ξΞλT(X)

Hakim önlemin seçimi, öncelikler ailesi için belirleyicidir. Örneğin , Glen_b'nin cevabında olduğu gibi üzerinde Normal ortalama bir olasılıkla karşılaşırsa , baskın önlem olarak Lebesgue ölçüsü seçildiğinde Normal öncelikler eşlenik olur. Bunun yerine , hakim önlem olarak seçerseniz, konjugat öncelikleri yoğunluğu olan dağıtım ailesi içinde bulunur μd μ ( 1 + μ 2 ) - 2 d μ exp { - α ( μ - μ 0 ) 2 }dμ(1+μ2)2dμ

exp{α(μμ0)2}α>0,  μ0R
bu baskın ölçüye göre ve artık normal öncelikler değildir. Bu zorluk, büyük olasılıkla, olasılığın belirli bir parametrelendirmesini seçme ve bu parametrelendirme için Lebesgue ölçümünü seçmeyle aynıdır. Bir olasılık işlevi ile karşılaşıldığında, parametre alanında doğal (veya içsel veya referans) baskın bir ölçü yoktur.

Bu üstel aile ortamının dışında, eşlenik önceliklere izin veren sabit bir desteğe sahip önemsiz bir dağıtım ailesi yoktur. Bu Darmois-Pitman-Koopman lemmasının bir sonucudur .


11
"en basit terimlerle mi?" Belki de önlemler hakkında önceden bilgi sahibi olmayan bir açıklama OP için daha yararlı olacaktır.

3
ne yazık ki, konjugat öncelikleri bir ölçü arka planı olmadan anlamsız (Evrendeki en iyi saklanan sır olsa bile) korkarım.
Xi'an

6
Benim düşünceme göre, "mümkün olan en basit terimler" yoruma açıktır ve ölçü teorisi gibi gelişmiş matematiği kullanan bir açıklama hala bir anlamda "basit", belki de bu tür makinelerden kaçınan bir açıklamadan "daha basit" olabilir. Her durumda, böyle bir açıklama, onu anlamak için gerekli altyapıya sahip biri için çok aydınlatıcı olabilir ve bir konuyu açıklamanın çeşitli yollarının bir listesine böyle bir cevabın dahil edilmesi zararsız olabilir. Sadece OP için değil, gelecekteki tüm okuyucular için de cevaplar yazıyoruz.
littleO

1
@LBogaardt Bu yanıtın hem konu hem de daha uygun bir seviyede olacağını düşündüğünüz bir veya daha fazla soruya bağlantı kurabilseniz eleştirileriniz daha fazla ağırlık taşıyacaktır. Lütfen "basit" terimin iyi tanımlanmış bir terim olmadığını ve farklı öznel yorumlara sahip olduğunu unutmayın. Ne olursa olsun, yorumlarınızın önerdiği gibi "matematiksel olarak sofistike olmayan" ile karıştırmak geçersiz olacaktır.
whuber

2
Xi'an'ın yanıtı benim için işe yaramaz. Bir şey öğrendim.
littleO

2

Bir dağıtımın "çekirdeği" kavramını kullanmayı seviyorum. Burası yalnızca parametreye bağlı parçalarda bıraktığınız yerdir. Birkaç basit örnek.

p(μ|a,b)=K1×exp(aμ2+bμ)
KK=exp(aμ2+bμ)dμ=πaexp(b24a)E(μ|a,b)=b2aVar(μ|a,b)=12a

p(θ|a,b)=K1×θa(1θ)b
K=θa(1θ)bdθ=Beta(a+1,b+1)

Olabilirlik fonksiyonuna baktığımızda, aynı şeyi yapabilir ve bunu "çekirdek formunda" ifade edebiliriz. Örneğin iid verileriyle

p(D|μ)=i=1np(xi|μ)=Q×f(μ)

Qf(μ)

p(D|μ)=i=1np(xi|μ)=i=1n12πexp((xiμ)22)=[i=1n12π]×i=1nexp((xiμ)22)=(2π)n2×exp(i=1n(xiμ)22)=(2π)n2×exp(i=1nxi22xiμ+μ22)=(2π)n2×exp(i=1nxi22)×exp(μi=1nxiμ2n2)=Q×exp(aμ2+bμ)

a=n2b=i=1nxiQ=(2π)n2×exp(i=1nxi22)

μ

p(μ|a0,b0)=K01exp(a0μ2+b0μ)
p(μ|D,a0,b0)K01exp(a0μ2+b0μ)×Q×exp(aμ2+bμ)=K01×Q×exp([a+a0]μ2+[b+b0]μ)exp([a+a0]μ2+[b+b0]μ)

Bir anlamda bir konjugat, daha önce gözlemlenen verilere "sahte veri" eklenmesine ve daha sonra parametrelerin tahmin edilmesine benzer şekilde davranır.


1
(+1) Sahte veri sezgisini takdir ediyorum!
Xi'an

1

Dlik

Dpri

DpriDlik

p(θ|x)posteriorp(x|θ)likelihoodp(θ)prior


Bu önceki bir eşleniğin ne olduğunu nasıl açıklar ?
LBogaardt

tamam bunu düzenleyeceğim.
Thomas G.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.