Bayesian posterior'un uygun bir dağılım olması gerekiyor mu?


21

Önceliklerin uygun olmadığına ve olasılık fonksiyonunun da 1 ile bütünleşmediğini biliyorum. Fakat posteriorun uygun bir dağılım olması gerekiyor mu? Öyle / değilse, ne anlama geliyor?

Yanıtlar:


15

, Bildiğim kadarıyla söyleyebilirim, soru posterior olmak zorunda olsun veya olmasın, çünkü (O biraz önce doğru olduğunda arka potansiyel uygunsuzluk odaklanmak önceki cevapları, okumak için bir sürpriz olduğunu doğru ( yani, bir ile bütünleştirilebilir) uygun (yani Bayesci çıkarım için kabul edilebilir) bir posterior olmak.

Bayesian istatistiklerinde, posterior dağılımın , posterior ortalama gibi anları türetebileceği bir olasılık dağılımı olması gerekir π [ h ( θ ) | x ]Eπ[h(θ)|x] ve güvenilir bir bölgenin kapsamı gibi olasılık ifadeleri, P(π(θ|x)>κ|x) . Eğer

f(x|θ)π(θ)dθ=+,(1)
posteriorπ(θ|x) olasılık yoğunluğuna normalleştirilemez ve Bayesian çıkarımı basitçe yapılamaz. Bu gibi durumlarda posterior yoktur.

Aslında, (1) her için geçerli olmalıdır x örnek uzayında sitesindeki ve sadece için gözlenen x , için, aksi takdirde, seçme öncesi bağlı olacaktır veri . Haldane'in önceki gibi önceki değerler bu araçlar π(p){1/p(1p)} , olasılık ile p binominal veya negatif binom değişkeni X arka için tanımlanmamıştır, çünkü kullanılamaz x=0 .

Birinin "uygunsuz posterleri" düşünebileceği bir istisna olduğunu biliyorum: David van Dyk ve Xiao-Li Meng tarafından "Veri Geliştirme Sanatı" nda bulundu . Uygun olmayan ölçü, gözlemin artırılmış bir dağılımın marjinali tarafından üretileceği şekilde çalışma parametresi üzerindedir, f ( x | θ ) = T ( x aug ) = x f ( x aug | θ , α )α ve van Dyk ve Meng, MCMC tarafından π ( θ | x ) (olasılık yoğunluğu olarak iyi tanımlanmış olarak kalır ) simülasyonunu hızlandırmak içinbu çalışma parametresi α üzerineuygunsuz bir p ( α ) koydu.

f(x|θ)=T(xAğustos)=xf(xAğustos|θ,α)dxAğustos
p(α)απ(θ|x)

Bir başka açıdan, eretmochelys'in cevabı ile ilgili olan Bayesçi karar teorisinin bir perspektifi olarak , (1) 'in meydana geldiği bir ortam, optimal kararlara yol açması halinde kabul edilebilir olabilir. Yani, eğer karar kullanarak etkisini değerlendirmek kaybı fonksiyonudur Í , bir Bayes optimal karar önce altında tt verilir δ ( x ) = arg dakika δ L ( δ , İçeride ISTV melerin RWMAIWi'nin ) fL(δ,θ)0δπ hususlar bu tamamlayıcı (her yerde olmadığını, tüm bu δ sonsuz). (1) 'in tutup tutmaması , guarant ⋆ ( x )' in türetilmesi için ikincildir, ancak kabul edilebilirlik gibi özellikler sadece (1) tutulduğunda garanti edilir.

δ(x)=argminδL(δ,θ)f(x|θ)π(θ)dθ
δδ(x)

19

Ön dağılım uygun olsa bile posterior dağılımın doğru olması gerekmez. Örneğin, , 0.25 (daha uygun olan) şekline sahip bir Gamma olduğunu varsayalım ve veri sıfırımızı x bir Gauss dağılımından çizilen şekilde, ortalama sıfır ve varyans v ile modelledik . Diyelim ki x sıfır olarak gözlendi. Daha sonra p ( x | v ) olasılığı v - 0.5 ile orantılıdır , bu da v için posterior dağılımını uygunsuz kılar , çünkü v - 1.25 e - v ile orantılıdırvxvxp(x|v)v0.5vv1.25ev. Bu sorun, sürekli değişkenlerin tuhaf doğası nedeniyle ortaya çıkar.


Güzel bir örnek, Tom!
Zen

+1, OP'nin son cümlesinin cevabını genişletebilir misiniz? Bu kaçık posterior anlamlı mı (genellikle posterior ile yapacağınız şeyleri yapabilir misiniz) veya bazı hesaplamalardan NaN veya Inf almak için daha mı benzer? Modelinizde bir sorun olduğuna dair bir işaret var mı?
Wayne

5
Modelde yanlış bir şey yok. Bu posterior, başka bir gözlem alırsanız, onu çoğaltabileceğiniz ve uygun bir posterior'a geri dönebileceğiniz anlamında anlamlıdır. Bu yüzden tüm diğer işlemlerin NaN olduğu bir NaN gibi değil.
Tom Minka

8
x=0

x0.25,1,x2

11

Bogus Data={x:f(xθ)π(θ)dθ=},
Pr(XBogus Data)=Bogus Dataf(xθ)π(θ)dθdx=Bogus Datadx.
Bogus Data01Bogus Data0Pr(XBogus Data)=0

Sözler: Posterioru uygunsuz kılan bu örnek değerlerin önceden tahmin edilebilirliği sıfıra eşittir.

Hikayenin ahlaki: boş kümelere dikkat edin, ısırtabilirler, ancak mümkün olamayacak olsa da.

Not: Prof. Robert tarafından yorumlarda belirtildiği gibi, önceliğin uygunsuz olması halinde bu akıl yürütme patlar.


4
Bir keresinde şöyle yazmışsınız : "Uygun bir önceyle başlayabilir ve uygunsuz bir posterior alabilirsek, çıkarımı bırakacağım."
Tom Minka

2
Yanaktan biraz dil, kesin bir miktar belirleyici vardı: Uygun bir öncekiyle başlayabilir ve mümkün olan her örnek değer için uygunsuz bir posterior elde edersek, çıkarımı bırakacağım. ;-)
Zen

Bu arada, olağanüstü bir hafıza, Tom!
Zen

4
Pr(XBogus Data)(θ,x)

1
Haklısın Cevaptaki gerekçeler yalnızca uygun önceliklerle çalışır. İyi bir nokta. Bir not ekleyeceğim.
Zen,

3

Herhangi bir "dağıtım", 1'e toplanmalı (veya bütünleşmelidir) 1'e normalize edilmemiş dağılımlarla çalışabileceği birkaç örnek düşünebilirim, ancak 1'e bir "dağıtım" dışında bir şeye marjinalleşen herhangi bir şeyi çağırmaktan rahatsızlık duyuyorum.

xd

x^=argmaxxPX|D(x|d)=argmaxxPD|X(d|x)PX(x)PD(d)=argmaxxPD|X(d|x)PX(x)

PDxx^PD|X(d|x)PX(x)


@Zen, bu cevapla ilgili neyin yanlış (veya temel olarak eksik) olduğunu düşündüğünüz konusunda daha açık bir fikir verir misiniz?
whuber

1
OP sorusunu yorumlamanın bir yolu "arkaya uygun bir dağıtım olması gerekiyor mu?" Uygun bir öncekle başlayıp matematiksel olmayan bir posteriorla bitip bitirmenin matematiksel olarak mümkün olup olmadığını sormaktır. Minka'nın cevabı, bunun gerçekleştiği açık bir örnektir. Bunu cevabımı tamamlamaya çalıştım ve bunun yalnızca bir dizi önceden tahmin edilebilir olasılık içinde olabileceğine işaret ettim.
Zen

1
@ Zen Bana yakından ilgili bir yorumlamanın "arka taraf uygun değilse, ondan hangi bilgileri alabilirim?" Olduğunu düşünüyorum. Bu kabul edilen cevap, özel bir durumda (açıkça tanımlandığı şekilde) bununla ilgili yararlı ve doğru tavsiyeler veriyor gibi görünmektedir. Kabul etme bana, eretmochelys'in, koşullar hakkında zekice bir tahminle eve çarpan bir sinyal gibi görünüyor.
whuber

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.