MCMC algoritmalarındaki hata örnekleri


28

Markov zinciri Monte Carlo yöntemlerinin otomatik kontrolü için bir yöntem araştırıyorum ve bu tür algoritmaları oluştururken veya uygularken ortaya çıkabilecek bazı hata örnekleri istiyorum. Yayımlanan bir makalede yanlış yöntem kullanılmışsa, bonus puan.

Özellikle hatanın, zincirin hatalı değişmeyen dağılıma sahip olduğu anlamına geldiği, ancak diğer hata türlerinin (örneğin zincir ergodik değil) de ilgi çekici olacağı durumlar ile ilgileniyorum.

Böyle bir hatanın örneği, Metropolis-Hastings önerilen bir hareketi reddettiği zaman bir değer üretememek olabilir.


7
En sevdiğim örneklerden biri Harmonik ortalama tahmincisi çünkü güzel asimptotik özelliklere sahip ama pratikte başarısız oluyor. Radford Neal bunu blogunda tartışıyor: "Kötü haber, bu tahmin edicinin doğru cevaba yaklaşması için gereken puan sayısının genellikle gözlemlenebilir evrendeki atom sayısından daha fazla olacağıdır". Bu yöntem uygulamalarda yaygın olarak uygulanmaktadır.

3
Bir diğeri Prof. Neal nezaket.
Cyan

5
@Cyan Neal'ın ciddiye alınması için, sadece internette yayınlamak yerine makalesini kabul edecek bir dergi bulması gerektiğini düşünüyorum. Haklı olduğuna, hakemlerin ve yazarın yanlış olduğuna kolayca inanabilirim. Yayınlanan sonuçlarla çelişen makalelerin yayınlanması zor olsa da ve JASA'nın reddi cesaret kırıcı olsa da, başarılı olana kadar diğer birkaç dergiyi denemeliydi. Bulgularınıza güvenilirlik eklemek için bölüm içi ve bağımsız bir hakeme ihtiyacınız var.
Michael R. Chernick

4
Biri hep Prof. Neal'ı ciddiye almalı! o) Cidden bunun gibi sonuçların yayınlanması zor, ve ne yazık ki modern akademik kültürün bu tür bir şeye değer vermeyeceği utanç verici, bu yüzden onun için yüksek öncelikli bir etkinlik değilse anlaşılabilir. İlginç bir soru, cevapları ile çok ilgileniyorum.
Dikran Marsupial

6
@Michael: Belki de. Neal'ın durumu da dahil olmak üzere, benzer durumların tüm taraflarında bulunduğum için, birçok durumda, benim anekdot gözlemlerim, kağıt reddinin çoğu durumda olduğu gibi, çoğu durumda olduğu gibi çok az bilgi içeriği taşıdığıdır. Hakem değerlendirmesi, insanların kabul etmekten daha gürültülü olduğu yönündedir ve burada olduğu gibi , oyunda kısmi ve ilgili (bağımsız değil) partiler ve çıkarlar vardır. Bununla birlikte, orjinal yorumumu bizi konuyla ilgili uzağa götürmek niyetinde değildim. konuyla ilgili düşüncelerinizi paylaştığınız için teşekkür ederiz.
kardinal

Yanıtlar:


11

1. Marjinal Olabilirlik ve Harmonik ortalama tahmincisi

Marjinal olasılık arka dağılımının normale sabiti olarak tanımlanır

p(x)=Θp(x|θ)p(θ)dθ.

Bu miktarın önemi oynadığı rolün gelen modeli karşılaştırıldığında aracılığıyla Bayes faktörleri .

Bu miktarın yaklaştırılması için çeşitli yöntemler önerilmiştir. Raftery ve diğ. (2007) sadeliği nedeniyle hızla popüler olan Harmonik ortalama tahmincisini önermektedir . Fikir ilişkinin kullanılmasından ibarettir.

1p(x)=Θp(θ|x)p(x|θ)dθ.

Posterior bir örnek varsa, bu nedenle, demek , bu miktar yaklaşık olarak hesaplanabilir(θ1,...,θN-)

1p(x)1N-Σj=1N-1p(x|θj).

Bu yaklaşım, Önem Örnekleme kavramı ile ilgilidir .

Neal'ın blogunda tartışıldığı gibi, büyük sayılar yasası uyarınca, bu tahmin edicinin tutarlı olduğunu biliyoruz . Sorun, iyi bir yaklaşım için gereken çok büyük olması olabilir. Bazı örnekler için Neal'ın bloguna veya Robert'in blogları 1 , 2 , 3 , 4'e bakın.N-

Alternatifler

yaklaşmak için birçok alternatif vardır . Chopin ve Robert (2008) bazı Önem örneklemesine dayalı yöntemler sunmaktadır.p(x)

2. MCMC örnekleyicinizi yeterince uzun süre çalıştırmama (özellikle multimodalite varlığında)

Mendoza ve Gutierrez-Peña (1999) , iki normal aracın oranı için önceki / arkadaki referansı bulur ve gerçek bir veri seti kullanarak bu modelle elde edilen çıkarımların bir örneğini sunar. MCMC yöntemlerini kullanarak, aşağıda gösterilen ortalamaların φ oranının arka kısmının boyutunda bir örnek elde ederler.2000φ

görüntü tanımını buraya girin

φ (0.63,5.29)00

görüntü tanımını buraya girin

(0,7.25)

3. Diğer bazı sorunlar böyle değerlendirmek yakınlaşma, değerlerini başlangıç seçenek olarak, zincirin zayıf davranışı bu bulunabilir tartışma Gelman, Carlin ve Neal tarafından.

4. Önem Örnekleme

Bir integrali yaklaştırmak için kullanılan bir metot, integralini yoğunluğu ile çarpmaktan ibarettir.g

ben=f(x)dx=f(x)g(x)g(x)dx.

g(x1,...,xN-)ben

ben1N-Σj=1N-f(xj)g(xj).

gfN-

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

2
Harika örnekler bunlar. İlgilenen herkes için, rakam ile editöre mektup burada: onlinelibrary.wiley.com/doi/10.1002/bimj.200800256/abstract
Simon Byrne

2
Çok güzel ve net özeti! (+1)
gui11aume

12

Onun Darren Wilkinson blogda rasgele yürüyüş Metropolis-Hastings ortak bir yanlışa ayrıntılı bir örnek verir. Tamamen okumanızı tavsiye ederim, ancak burada tl; dr versiyonudur.

Hedef dağılımı bir boyutta (Gamma dağılımları gibi ) pozitifse , o boyutta negatif bir değeri olan önerileri hemen reddetmek caziptir. Hata, hiç olmadığı gibi teklifleri atmak ve sadece diğerlerinin Metropolis-Hastings (MH) kabul oranını değerlendirmektir. Bu bir hatadır çünkü simetrik olmayan bir teklif yoğunluğu kullanıyor.

Yazar iki düzeltmeden birini uygulamanızı önerir.

  1. “Olumsuzları” başarısız kabul olarak kabul et (ve biraz verim kaybet).

  2. Bu durumda doğru MH oranını kullanın.

π(x*)π(x)Φ(x)Φ(x*),

πΦφ Φ(x)=0φ(y-x)dy


1
+1 İlginç bir örnek. MH ile kabul oranı ile ilgili diğer konuları da düşünüyordum. Ben 0.234 optimal oranın aşırı kullanıldığını düşünüyorum.

@Procrastinator MCMC literatürünü çok iyi biliyorsunuz. Bu sizin uzmanlık alanınız mı?
gui11aume

Yorumun için teşekkürler. Bayesian istatistiklerini seviyorum, daha sonra MCMC çaprazını taşımalıyım;).

1

Çok net bir durum (ilk cevapta belirtilen marjinal olabilirlik yaklaşımı ile bağlantılı) gerçek yakınsama, Chib'in (1995) tahmincisinin kullanımıyla birleştiğinde karışım modellerinde etiket değiştirme probleminin bir örneğidir . Radford Neal'in (1999) işaret ettiği gibi , eğer MCMC zinciri doğru bir şekilde birleşmezse, hedef dağılım modunun bir kısmını keşfediyor olması anlamında, Chib'in Monte Carlo yaklaşımı doğru sayısal değere ulaşamaz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.