Birisi bana NUTS'u İngilizce olarak açıklayabilir mi?


18

Algoritmayı anlama şeklim şudur:

Hiçbir U Dönüşü Örnekleyici (NUTS), Hamiltonian Monte Carlo Yöntemidir. Bu, bir Markov Zinciri yöntemi olmadığı anlamına gelir ve bu nedenle, bu algoritma, genellikle verimsiz ve yakınsama yavaş olarak kabul edilen rastgele yürüyüş parçasından kaçınır.

Rastgele yürüyüş yapmak yerine, NUTS x uzunluğunda atlar yapar. Her atlama algoritma çalışmaya devam ettikçe iki katına çıkar. Bu, yörünge başlangıç ​​noktasına dönmek istediği bir noktaya ulaşıncaya kadar olur.

Sorularım: U dönüşü ile ilgili özel olan nedir? Yörüngeyi ikiye katlamak optimize edilmiş noktayı nasıl atlamaz? Yukarıdaki açıklamam doğru mu?


Bu yazıyı buldum ve resimli simülasyonlar kavramların açıklamasında gerçekten bir fark yaratıyor.
kael

Yanıtlar:


13

U dönüşü olmayan bit, tekliflerin nasıl oluşturulduğudur. HMC varsayımsal bir fiziksel sistem üretir: belirli bir kinetik enerjiye sahip bir topun vadilerden ve tepelerden oluşan bir manzara etrafında yuvarlandığını hayal edin (analoji, örneklemek istediğiniz posterior tarafından tanımlanan). Yeni bir MCMC örneği almak istediğinizde, kinetik enerjiyi rastgele seçer ve bulunduğunuz yerden topu yuvarlamaya başlarsınız. Ayrık zaman adımlarında simüle edersiniz ve parametre uzayını doğru bir şekilde keşfettiğinizden emin olmak için adımları bir yönde ve iki kez diğer yönde iki kez taklit eder, tekrar dönersiniz vb. Bir noktada bunu durdurmak ve iyi bir yol istiyorsunuz. Bunu yapmak bir U dönüşü yaptığınız zamandır (yani her yere gitmiş gibi görünmektedir).

Bu noktada Markov Zincirinizin önerilen bir sonraki adımı (belirli sınırlamalarla) ziyaret ettiğiniz noktalardan seçilmektedir. Yani varsayımsal fiziksel sistemin tüm simülasyonu, daha sonra kabul edilen (bir sonraki MCMC örneği önerilen nokta) veya reddedilen (bir sonraki MCMC örneği başlangıç ​​noktasıdır) bir teklif almak için "sadece" idi.

Bu konuda akıllı olan şey, tekliflerin posteriorun şekline dayanarak yapılması ve dağıtımın diğer ucunda olabilmesidir. Aksine Metropolis-Hastings (muhtemelen çarpık bir top) içinde önerilerde bulunur, Gibbs örneklemesi bir seferde yalnızca bir (veya en az çok) boyut boyunca hareket eder.


" Her yere gitmiş gibi görünüyor " yorumunu genişletebilir misiniz lütfen?
Gabriel

1
Yani, NUTS'un tamamen geri dönüp dönmediğinize karar vermeye çalıştığı dağıtımı kapsadığına dair bir işaret var. Durum buysa, umarım bir MCMC adımında posteriorun herhangi bir bölümüne gidebilirsiniz. Tabii ki, durum gerçekten tüm posterior'u keşfettiğinizi garanti etmez, bunun yerine "mevcut kısmını" keşfettiğinizi gösterir (eğer bazı multimodal dağılımınız varsa tüm parçalara ulaşmakta sorun yaşayabilirsiniz) dağıtım).
Björn

6

HMC'nin bir Markov Zinciri yöntemi olmadığı konusunda yanılıyorsunuz. Wikipedia Başına :

Matematik ve fizikte, Hamiltonian Monte Carlo olarak da bilinen melez Monte Carlo algoritması, doğrudan örneklemenin zor olduğu bir olasılık dağılımından rasgele örnekler dizisi elde etmek için bir Markov zincir Monte Carlo yöntemidir. Bu dizi dağılımı (yani bir histogram üretmek için) yaklaşık olarak veya bir integrali hesaplamak için (beklenen bir değer gibi) kullanılabilir.

Daha fazla netlik için, NUTS sonlandırma kriterlerini belirten Betancourt'un arXiv belgesini okuyun :

... bir yörüngenin mevcut enerji seviyesi etrafında mahallenin yeterli keşfini sağlayacak kadar uzun olduğunu belirleyin. Özellikle, hem çok kısa bütünleşmekten kaçınmak istiyoruz, bu durumda Hamilton yörüngelerinden tam olarak yararlanmayacağız ve çok uzun bütünleşelim, bu durumda sadece azalan getiriler sağlayan keşif için değerli hesaplama kaynaklarını harcıyoruz.

Ek A.3, bahsettiğiniz iki katına çıkan yörünge gibi bir şeyden bahsediyor:

Ayrıca, her yinelemede yörünge uzunluğunu iki katına çıkararak daha hızlı genişleyebiliriz, buna karşılık gelen örneklenmiş bir durum olan z ′ ∼ T (z ′ | t) ile örneklenmiş bir yörünge t ∼ T (t | z) = U T2L veririz. Bu durumda, her yinelemede hem eski hem de yeni yörünge bileşenleri mükemmel, düzenli ikili ağaçların yapraklarına eşdeğerdir (Şekil 37). Bu, yeni yörünge bileşenlerini özyinelemeli olarak oluşturmamızı ve özyinelemenin her adımında bir örnek yaymamızı sağlar ...

ve bunun dinamik bir uygulamadan söz ettiği A.4'te genişler (bölüm A.3 statik bir uygulamadan bahseder):

Neyse ki, Bölüm A.3'te tartışılan etkin statik şemalar, bir yörüngenin karşılık gelen enerji seviyesini ayarlamak için yeterince uzun büyüdüğünü belirlemek için bir kriter seçtikten sonra dinamik bir uygulama elde etmek için tekrarlanabilir.

Bence anahtar, iki kat atlamamasıdır, bir sonraki atlamasını, bir ölçüt karşılanana kadar önerilen atlamanın uzunluğunu iki katına çıkaran bir teknik kullanarak hesaplar. En azından şu ana kadar gazeteyi böyle anlıyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.