Bayesian ortamında önceki “unutkanlık”?


9

Bu size daha fazla kanıt olduğu (daha büyük şeklinde söylüyorlar iyi bilinmektedir için , Bayes önce "unutulmuş" olur iid örnekler) ve çıkarım çoğu kanıt (veya olasılık) tarafından etkilenir.nn

Çeşitli özel durumlar için bunu görmek kolaydır (önceden Beta ile Bernoulli veya diğer örnek türleri) - ancak ile genel durumda görmenin bir yolu var ve bazı önceki ?x1,...,xn~p(x|μ)p(μ)

DÜZENLEME: Ben herhangi bir önceki durumda genel durumda gösterilemeyeceğini tahmin ediyorum (örneğin, bir nokta-kütle önce posterior bir nokta-kütle tutardı). Ama belki de bir öncünün unutulduğu belirli koşullar vardır.

İşte böyle bir şey göstermek düşünüyorum "yol" tür:

Parametre alanı olduğunu kabul edelim ve izin ve olan tüm ilgili yer sıfır olmayan olasılık kütle iki önceki değerler olmak . Yani, önceki her bir miktar için iki arka hesaplama:Θp(θ)q(θ)Θ

p(θ|x1,...,xn)=Πbenp(xben|θ)p(θ)θΠbenp(xben|θ)p(θ)dθ

ve

q(θ|x1,...,xn)=Πbenp(xben|θ)q(θ)θΠbenp(xben|θ)q(θ)dθ

Eğer bölerseniz tarafından (posteriors), sonra elde edersiniz:pq

p(θ|x1,...,xn)/q(θ|x1,...,xn)=p(θ)θΠbenp(xben|θ)q(θ)dθq(θ)θΠbenp(xben|θ)p(θ)dθ

Şimdi terimine giderken yukarıdaki terimi incelemek istiyorum . İdeal olarak "mantıklı" veya başka bir güzel davranış için belirli bir için gider , ama orada bir şey göstermek için nasıl anlayamıyorum.n1θ


1
Bazı sezgiler için, olasılığın örnek boyutu ile ölçeklendiğini, ancak öncekinin ölçmediğini unutmayın.
Makro

@Macro, teşekkürler, sezgim de vardı, ama daha fazla zorlayamadım. Yukarıdaki düzenlemelerime bakın.
bayesianOrFrequentist

Ghosh ve Ramamoorthi'nin Bayesian Nonparametrik ders kitabının ilk birkaç bölümü , bahsettiğiniz şeyleri (önce parametrik bir ortamda, sonra parametrik olmayan bir bölümde) ortaya çıkarır; uygun bir kurumdaysanız Springer üzerinden çevrimiçi olarak ücretsiz olarak erişilebilir. Önceki asimptotik bağımlılık eksikliğini resmileştirmenin birçok yolu vardır, ancak elbette birkaç düzenlilik koşulu vardır.
adam

Posterior oranın önceki oranla doğru orantılı olduğunu unutmayın, bu nedenle olasılık veya kanıt oranı bunu gerçekten etkilemez.
olasılık

Yanıtlar:


3

Sadece kaba ama umarım sezgisel bir cevap.

  1. Günlük alanı bakış açısından bak:

    -günlükP(θ|x1,...,xn)=-günlükP(θ)-Σben=1ngünlükP(xben|θ)-Cn
    nerede Cn>0verilere bağlı olan, ancak parametreye bağlı olmayan ve olasılıklarınızın iid gözlemlerinin alındığı bir sabittir. Bu nedenle, sadece posteriorunuzun şeklini belirleyen kısma konsantre olun, yani
    Sn=-günlükP(θ)-Σben=1ngünlükP(xben|θ)
  2. Varsayalım ki D>0 öyle ki logP(θ)D. Bu, ayrık dağılımlar için makuldür.

  3. Terimlerin hepsi olumlu olduğu için, Sn"büyüyecek" (teknik özellikleri burada atlıyorum). Ancak öncekinin katkısıD. Bu nedenle, öncekinin katkıda bulunduğu kesir, ki bu en fazlaD/Sn, her ek gözlemle monoton olarak azalır.

Elbette titiz kanıtlar teknik özelliklerle yüzleşmek zorundadır (ve çok zor olabilirler), ancak yukarıdaki ayar IMHO'nun en temel parçasıdır.


0

“Önceden unutulmuş” ve “çıkarımın çoğu kanıttan etkileniyor” ifadelerinin ne anlama geldiği konusunda biraz kafam karıştı. Veri miktarı arttıkça, tahmin edicinin (sıralarının) öncekimizden bağımsız olarak parametrenin gerçek değerine yaklaştığını kastediyorum.

Posterior dağılım şeklindeki bazı düzenlilik koşulları varsayıldığında, Bayes Tahmincileri tutarlı ve asimptotik olarak tarafsızdır (bkz. Gelman ve ark., Bölüm 4 ). Bu, numune boyutu arttıkça bayes tahmincisinin parametrenin gerçek değerine yaklaştığı anlamına gelir. Tutarlılık , bayes tahmin edicisinin olasılıkla gerçek parametre değerine yakınsadığı anlamına gelir ve asimptotik tarafsızlık ,θ0 parametrenin gerçek değeridir,

E[θ^|θ0]-θ0Vbirr(θ^)p0

Yakınsama, öncekinin spesifik biçimine bağlı değildir, sadece öncekinden ve olasılıktan elde edilen arka dağılımın düzenlilik koşullarını karşıladığına bağlıdır.

Gelman ve arkadaşları adı geçen en önemli düzenlilik durumu olabilirlik parametresi, sürekli bir fonksiyonu ve parametrenin gerçek değeri olması olması olan parametre alanı. Ayrıca, belirttiğiniz gibi, posterior, parametrenin gerçek değerinin gerçek değerinin açık bir mahallesinde sıfırdan farklı olmalıdır. Genellikle, önceliğiniz tüm parametre alanında sıfırdan farklı olmalıdır.


teşekkürler, çok anlayışlı. Aslında "gerçek" parametre değeri ile ilgili olmayan bir sonuç için umuyordum. Sadece teknik olarak göstermek, daha fazla kanıtınız olduğu için, alacağınız posterior, daha önce başladığınız şeyden bağımsız olarak aynıdır. Bunu yansıtacak bazı düzenlemeler yapacağım.
bayesianOrFrequentist

Baybay merkezi limit teoremine bir göz atın .
Stéphane Laurent
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.