Yanma sonrası MCMC yinelemeleri yoğunluk tahmini için kullanılabilir mi?


10

Yakıldıktan sonra, MCMC yinelemelerini doğrudan bir histogram veya çekirdek yoğunluğu tahmini gibi yoğunluk tahmini için kullanabilir miyiz? Benim endişem MCMC yinelemelerinin, en fazla aynı şekilde dağıtılmış olmalarına rağmen, bağımsız olmalarıdır.

MCMC tekrarlarına daha fazla inceltme uygularsak ne olur? Benim endişem MCMC yinelemelerinin en fazla ilişkisiz olması ve henüz bağımsız olmamasıdır.

Ampirik dağılım fonksiyonunu gerçek dağılım fonksiyonunun bir tahmini olarak kullanmayı öğrendiğim temel , ampirik dağılım fonksiyonunun bir iid örneğine göre hesaplandığı Glivenko-Cantelli teoremine dayanmaktadır. Histogramları veya çekirdek yoğunluk tahminlerini yoğunluk tahminleri olarak kullanmak için bazı gerekçeler (asimtotik sonuçlar?) Görüyordum, ancak bunları hatırlayamıyorum.

Yanıtlar:


10

MCMC örneklemesinden yoğunlukları tahmin edebilir ve insanlar tahmin edebilirsiniz.

Akılda tutulması gereken bir şey, histogramlar ve KDE'ler uygun olsa da, en azından basit durumlarda (Gibbs örneklemesi gibi), çok daha verimli yoğunluk tahminlerinin mevcut olabileceğidir.

Özellikle Gibbs örneklemesini düşünürsek, örneklemiş olduğunuz koşullu yoğunluk, yoğunluğun ortalama bir tahminini üretmek için örnek değerin kendisi yerine kullanılabilir. Sonuç oldukça düzgün olma eğilimindedir.

Yaklaşım

Gelfand ve Smith (1990), "Marjinal Yoğunlukların Hesaplanmasında Örneklemeye Dayalı Yaklaşımlar"
Amerikan İstatistik Kurumu Dergisi , Cilt. 85, No. 410, sayfa 398-409

( Geyer , örnekleyici bağımlılığının yeterince yüksek olması durumunda her zaman varyansı azaltmadığı ve bunun için koşullar sağladığına dikkat çekiyor)

Bu yaklaşım, örneğin Robert, CP ve Casella, G. (1999) Monte Carlo İstatistiksel Yöntemleri'nde de tartışılmaktadır .

Bağımsızlığa ihtiyacınız yok, aslında bir ortalama hesaplıyorsunuz. Yoğunluk tahmininin standart bir hatasını (veya bir cdf) hesaplamak istiyorsanız , bağımlılığı hesaba katmanız gerekir.

Aynı düşünce elbette diğer beklentiler için de geçerlidir ve bu nedenle diğer birçok ortalama türün tahminlerini iyileştirmek için kullanılabilir.


Teşekkürler! Marjinal dağılımların ortak dağılımdan beklentiler olması nedeniyle, marjinal dağılımları tahmin etmek için ilişkili MCMC yinelemelerinin kullanılması önemli değil mi? Eklem dağılımını tahmin etmek için ilişkili yinelemeleri kullanırsanız ne olur? Hala iyi misin?
Tim

Hayır, demek istediğim bu. Demek istediğim, ele aldığımız tahmin ediciler bir şeylerin ortalamasıdır ve bu şeylerin beklentileri olarak yorumlanabilecek nüfus miktarlarını tahmin etmek için kullanılmaktadır. Evet, ortak bir dağılımı aynı anlamda tahmin etmek için bağımlı çekilişleri kullanabilirsiniz.
Glen_b

Ortak dağılımı tahmin etmek için neden ilişkili yinelemeleri kullanabiliriz? Bence hayır, çünkü ortak dağıtım bir şeyin beklentisi değildir. Glivenko-Cantelli teoreminde ampirik cdf'nin iid örneği üzerinde hesaplandığını unutmayın.
Tim

Yoğunluk için, örneğin burada açıklanan örnek tahmini gibi bir şeyi düşünebilirsiniz (ve giderek dar olan bölmelere sahip bir histogramın limiti olarak düşünülebilir); bu bir ortalama ve beklentisinin yoğunluk olduğuna inanıyorum. Cdf ile ilgili olarak, ampirik cdf ile ortalama olarak yapmak için bir şeyler yapıp yapamayacağınızı düşünebilirsiniz. Her iki fikir de ortak bir dağıtımdan alınan örneklerle çalışıyor gibi görünmektedir.
Glen_b

3

Devam et

MCMC yinelemelerini doğrudan herhangi bir şey için kullanabilirsiniz, çünkü gözlemlenebilirinizin ortalama değeri asimptotik olarak gerçek değere yaklaşacaktır (çünkü yanma peşindesiniz).

Bununla birlikte, bu ortalamanın varyansının örnekler arasındaki korelasyonlardan etkilendiğini unutmayın. Bu, numuneler MCMC'de olduğu gibi ilişkilendirilirse, her ölçümün saklanmasının gerçek bir avantaj sağlamayacağı anlamına gelir.

Teorik olarak, N adımından sonra ölçmelisiniz, burada N ölçtüğünüz gözlemlenebilir otokorelasyon süresidir.

Detaylı açıklama

xttf

xtRf=fa(x)x[a,a+Δ]xtP(x)

f

F=1Ni=1Nf(xi)

FP(x)

F=1Ni=1Nf(xi)=f(x)

elde etmek istediğiniz budur.

F2F2

i=1Nj=1Nf(xi)f(xj)

xtj=i+ΔfR(Δ)

Özetlemek gerekirse:

  • Hesaplamalı olarak her ölçüyü saklamak için herhangi bir maliyeti yoktur, bunu yapabilirsiniz, ancak varyansın normal formül kullanılarak hesaplanamayacağını unutmayın.

  • ττ


n

İnceltme sadece yararlı verilerin israfıdır. Tahminin varyansını azaltmaz. Bu soruya yapılan yorumlara bakın: stats.stackexchange.com/a/258529/58675
DeltaIV

@DeltaIV, evet. Demek istediğim, incelme ya da seyretmeme, ilgili zaman ölçeği hala otokorelasyon zamanı.
Jorge Leitao
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.