ABC ve MCMC'nin uygulamalarında farkı nedir?


15

Anladığım kadarıyla, Yaklaşık Bayessel Hesaplama (ABC) ve Markov Zinciri Monte Carlo'nun (MCMC) çok benzer amaçları var. Aşağıda bu yöntemleri ve bunların gerçek hayat verilerine uygulanmasındaki farklılıkları nasıl algıladığımı anlıyorum.

Yaklaşık Bayes Hesaplaması

ABC parametre örnekleme de oluşur θ yoluyla, bir önceki sayısal simülasyon işlem bir istatistik xi bazı gözlenen ile karşılaştırıldığında xobs . Bir reddetme algoritmasına dayanarak, xi korunur veya reddedilir. Alıkonan xi s listesi posterior dağılımı yaptı.

Markov Zinciri Monte Carlo

MCMC, parametresinin önceden dağılımını örneklemekten oluşur θ. İlk örneği alır , ve ardından (bazı kurala göre) yeni bir değere , burada tekrar hesaplanır. Oranı hesaplanır ve bir eşik değerine bağlı olarak, bir sonraki atlama birinci veya ikinci konumdan meydana gelecektir. değerlerinin keşfi bir ve bir gider ve sonunda, korunan değerlerinin dağılımı arka dağılım P ( x o b s | θ 1 ) P ( θ 1 ) θ 2 P ( x o b s | θ 2 ) P ( θ 2 ) P ( x o b s | θ 2 ) P ( θ 2 )θ1P(xobs|θ1)P(θ1)θ2P(xobs|θ2)P(θ2)P(xobs|θ2)P(θ2)P(xobs|θ1)P(θ1)θθP(θ|x) (hala bilinmeyen bir nedenden dolayı).

Açıklamalarımın bu terimlerin her birinde (özellikle MCMC için) mevcut olan çeşitli yöntemleri temsil etmediğini fark ediyorum.

ABC - MCMC (Avantaj ve Dezavantajlar)

ABC, birinin yı analitik olarak çözmesi gerekmemesi avantajına sahiptir . Bu tür ABC, MCMC'nin bunu yapmayacağı karmaşık model için uygundur.P(x|θ)P(θ)

Ben ABC ile mümkün olduğunu düşünmüyorum MCMC istatistiksel testler (olasılık oranı testi, G-testi, ...) sağlar.

Şimdiye kadar haklı mıyım?

Soru

  • ABC ve MCMC'nin uygulamalarında farkı nedir? Biri bir ya da başka bir yöntemi kullanmaya nasıl karar verir?

1
"MCMC, θ parametresinin önceden dağılımını örneklemekten oluşur." Biri bunu kesinlikle yapabilirken, çoğu durumda gerekli değildir, hatta arzu edilmez. Birçok MCMC başvurusu için, θ1 (örneğin, küçük standart sapmaya sahip bir gaussian) merkezli bir aday dağıtımdan θ2'yi örnekliyoruz, daha sonra yukarıda belirttiğiniz gibi kabul / reddet oranını hesaplıyoruz. Bu, öncekinden örnek aldığımız ABC ile zıttır (ve genellikle ABC'ye önceki bilgileri dahil etmenin tek yoludur).
z_dood

Yanıtlar:


12

Björn'in cevabı üzerine bazı ek yorumlar:

  1. ABC ilk olarak Rubin (1984) tarafından hesaplama amaçları yerine Bayesci çıkarımın doğasının bir açıklaması olarak tanıtıldı. Bu yazıda örnekleme dağılımı ve önceki dağılımın posterior dağılımı üretmek için nasıl etkileştiklerini açıklamıştır.

  2. Ancak ABC öncelikle hesaplama nedenleriyle sömürülür. Nüfus genetikçileri, gözlemlenen örneğin olasılığının inatçı olduğu ağaç tabanlı modellerde yöntem geliştirdiler. Bu tür ortamlarda bulunan MCMC (Veri Büyütme) şemaları son derece verimsizdi ve tek bir boyut parametresiyle bile önem örneklemesi yapıldı ... Özünde ABC, MCMC veya PMC gibi Monte Carlo yöntemlerinin yerine geçerken bunlar tüm pratik amaçlar için mevcut değildir. Kullanılabilir olduklarında, ABC daha hızlı çalışırsa kalibre etmek için kullanılabilecek bir proxy olarak görünür.

  3. Daha modern bir bakış açısıyla, ABC'yi kişisel olarak bir hesaplama tekniğinden ziyade yaklaşık bir çıkarım yöntemi olarak görüyorum. Yaklaşık bir model oluşturarak, ilgili parametreye kesin bir modele güvenmeksizin çıkarım yapabilir. Bu ayarda bir dereceye kadar doğrulama gerekli olmakla birlikte, model ortalaması alma veya parametrik olmayan işlemlerden daha az geçerli değildir. Aslında ABC, parametrik olmayan Bayesci istatistiklerin özel bir türü olarak görülebilir.

  4. Orijinal model ve verileri gürültülü olanla değiştirirse, (gürültülü) ABC'nin mükemmel bir şekilde tanımlanmış bir Bayesci yaklaşım olduğu da gösterilebilir. Bu şekilde düşünebileceğiniz tüm Bayesci çıkarımlara izin verir. Test dahil. Bizim girişi ABC ve hipotez testi hakkında tartışmaya ABC altında yatan yaklaşık modeli olarak sona erebilir olmasıdır kötü donanımlı değil veriler verilen hipotez alaka değerlendirmek için, ancak mutlaka nüfus ABC çoğu uygulamalar beri sadece de ki, genetik model seçimi ile ilgilidir.

  5. Daha yeni bir perspektifte, ABC'yi, istatistiksel bir modelin parametrelerinin önceden belirlenmiş bir istatistiğin anlarıyla ilişkili olduğu dolaylı çıkarımın Bayesci bir versiyonu olarak görebiliriz . Bu istatistik bu parametreleri tanımlamak için yeterliyse (veya yerel anlamda yeterliyse), ABC'nin gözlem sayısı ile parametrelerin gerçek değerine yakınsadığı gösterilebilir .


2
Bu yanıtı kontrol ettim ama önce @ Björn'in cevabını (+1) ve sonra Xi'an'ın cevabını okumanızı tavsiye etmek istiyorum.
Remi.b

12

P(x|θ)θsimüle edilen veriler en sık (yaklaşık olarak) gözlemlenen verilerle eşleşir (önerilen değerler, örneğin öncekinden rastgele çizilir). Çok büyük olmayan bir örnek büyüklüğüne sahip tek bir binom rastgele değişken gibi basit durumlar için bile tam bir eşleşme gerekebilir ve bu durumlarda, bu yapamayacağınız bu arka örneklerle kesinlikle yapamayacağınız hiçbir şey yoktur. standart MCMC örnekleri. Kesintisiz (çok değişkenli ayrık sonuçlar için bile) ve kesin eşleşme gerektiren potansiyel olarak çok değişkenli sonuçlar için daha karmaşık durumlar artık mümkün değildir.

Aslında ABC'nin MCMC versiyonları vardır, bu da posterior ile yakından benzemeyen bir önceliğiniz varsa (örn. Öncekinden çok bilgi vermediğinden) örnekleme öncekinden çizim yaparak aşırı derecede verimsiz olduğu için çok nadiren gözlemlenen ve simüle edilen veriler arasında yakın bir eşleşme olsun.

P(x|θ)P(x|θ)P(x|θ)analitik olarak mevcut değildir. Elbette bu gibi durumlarda (örneğin, INLA, olasılıklara ikinci dereceden yaklaşımlar, vb.) Belirli problemler için daha etkili / başarılı olabilecek başka seçenekler de olabilir. Bir bakıma, ABC'nin posterior örnekleriyle yapabileceklerinizdeki herhangi bir sınırlama, sadece gerçek ve simüle edilmiş veriler arasında yaklaşık bir eşleşme gerektirmekten kaynaklanır (kesin bir eşleşme gerektirebilirseniz, hiç sorun olmazdı). Birkaç iyi giriş belgesi vardır, örneğin Marin ve ark. (2012) . Ortak yazarlardan en az biri (@ Xi'an) burada aktif bir katkıda bulunuyor ve burada da düşüncelerini sevmek isterim - Test konusunda çok daha fazla şey söyleyebileceğine inanıyorum.


Umarım bağlantıyı şimdi düzeltmeyi başardım (şimdi benim için çalışıyor).
Björn

1
(+1) çok iyi puanlar!
Xi'an

1
"P (x | θ) analitik olarak mevcut olduğunda, standart bir MCMC'nin kullanılmasının neredeyse her zaman tercih edileceğini varsayıyorum." Neredeyse ama her zaman değil. Birisinin birçok parametreyle birleştirilen çok büyük bir örnek boyutuna (10 ^ 9) sahip olduğunu düşünün. Her bir parametre seti olasılığını yeniden hesaplamak çok pahalı hale gelir. ABC ile, bunu hızlandırmak için kullanabileceğiniz birçok püf noktası var. MCMC ile çok fazla değil.
z_dood

2
@z_dood: olasılığı gerçekten hesaplamak için çok fazla gözlem olduğunda, örneğin farklı bilgisayarlarda depolanması gerektiğinde, olasılık işlevinin analitik olarak kullanılabilir olmadığı tartışılır hale gelir.
Xi'an
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.