MCMC / EM sınırlamaları? EM üzerinden MCMC?


9

Şu anda R'den JAGS kullanarak hiyerarşik Bayesian modelleri ve ayrıca Python ( "Hackerlar için Bayesian Yöntemleri" ) kullanarak pymc öğreniyorum .

Bu yazıdan biraz sezgi alabilirim : "sanki", bir şekilde bilmek istediğiniz karmaşık dağıtımdan bağımsız örnekler almayı başarmış gibi görünen bir yığın sayı ile sonuçlanacaksınız. " Koşullu olasılığı verebileceğim gibi bir şey, o zaman koşullu olasılığa dayalı hafızasız bir süreç oluşturabilirim. İşlemi yeterince uzun süre oluşturduğumda, ortak olasılık birleşebilir. Ve sonra üretilen dizinin sonunda bir yığın sayı alabilirim. Sanki karmaşık eklem dağılımından bağımsız örnekler alıyorum. Örneğin, histogram yapabilirim ve dağıtım fonksiyonuna yaklaşabilir.

O zaman benim sorunum, bir MCMC belirli bir model için yakınsama olup olmadığını kanıtlamak gerekir mi? Bunu bilmek için motive oldum çünkü daha önce GMM ve LDA (grafik modeller) için EM algoritmasını öğrendim. Eğer yakınsamasını kanıtlamadan MCMC algoritmasını kullanabilirsem, EM'den çok daha fazla zaman kazanabilir. Beklenen günlük olabilirlik fonksiyonunu hesaplamak zorunda olacağım (posterior olasılığı hesaplamak zorunda kalacağım) ve sonra beklenen günlük olasılığını en üst düzeye çıkaracağım. Görünüşe göre MCMC'den daha hantal (sadece şartlı olasılığı formüle etmem gerekiyor).

Ayrıca, olasılık fonksiyonunun ve önceki dağıtımın eşlenik olup olmadığını merak ediyorum. MCMC'nin yakınsama gerektiği anlamına mı geliyor? MCMC ve EM'nin sınırlarını merak ediyorum.


2
MCMC şu şekilde birleşir: ntanım olarak. Aksine o zaman ispat teşhis modeliniz örneğin tümleşik olup olmadığını kontrol etmek için yakınlaşma math.pku.edu.cn/teachers/xirb/Courses/QR2013/ReadingForFinal/... veya people.fas.harvard.edu/~plam/teaching/methods / yakınsama /…
Tim

3
EM daha hızlıdır, Bayesci değildir (herkes Bayes istatistiklerini sevmez) ve bazı durumlarda daha az tanımlanabilirlik sorununa sahiptir ( MCMC yaklaşımı ile nokta tahmininden daha karmaşık olabilecek bir bütün dağılımınız olurken, tek bir maksimum değere dönüşür ) vb.
Tim

2
EM, maksimum olasılık veya maksimum posteriori tahmin için kullanılır, ancak başlangıçta ML algoritması olarak tanımlanır ve ML yaklaşımında yaygın olarak kullanılır (bkz. En.wikipedia.org/wiki/… ).
Tim

1
ML yerine MAP tahmini için EM kullansanız bile, benim için Bayesci değildir, çünkü arka dağılımı karakterize etmeye çalışır, ancak yalnızca yerel modunu alır.
Luca

1
Benim için EM'yi kullanmak Bayesci değildir, çünkü size ilgilendiğiniz parametrelerin bir nokta tahminini verir ve tüm posterior dağılımı ölçmez. Hem EM hem de MCMC ile, öncelikler, gizli ve gözlenen rastgele değişkenlerle tam olasılıklı bir model olabilir, ancak çıkarım farklıdır. EM, tam posterior dağılımın bilgisini aktarmazken MCMC tüm posterior dağılımı karakterize etmeyi amaçlamaktadır. Benim için bir Bayesci karar dağıtımı için posterior dağılımı kullanan biri. Ancak, bu basit olabilir. Ben de bunları öğreniyorum.
Luca

Yanıtlar:


13

EM bir optimizasyon tekniğidir: faydalı gizli değişkenlerle bir olasılık göz önüne alındığında, başlangıç ​​değerine bağlı olarak küresel bir maksimum olabilecek yerel bir maksimum döndürür.

MCMC bir simülasyon yöntemidir: gizli değişkenler olsun olmasın, bir olasılıkla, arka dağılımdan yaklaşık olarak dağılmış bir örnek üretir. Söz konusu numunenin ilk değerleri genellikle başlangıç ​​değerine bağlıdır, yani genellikle yanma (veya ısınma) aşaması olarak atılırlar.

Bu örnek posterior dağılım ile ilişkili integralleri değerlendirmek için kullanıldığında [vakaların ezici çoğunluğu], yakınsama özellikleri ergodik teorem nedeniyle esas olarak bir iid Monte Carlo yaklaşımıyla aynıdır.

Daha fazlasına ihtiyaç duyulursa, yani (xt,...,xt+T) posteriordan bir örnek π(x|D), bazı yakınsama değerlendirme teknikleri, örneğin R paket CODA'sında mevcuttur . Teorik olarak, yakınsama sağlayan araçlar muhtemelen ulaşılamayacak kadar uzaktır. Örneğin, mükemmel örnekleme veya yenileme yöntemleri .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.