Bayesian güncellemesi yeni verilerle


17

N veri noktasını gözlemledikten sonra önceki bir N ~ (a, b) ile bir posteriorun nasıl hesaplanacağı hakkında? Veri noktalarının örnek ortalamasını ve varyansını hesaplamamız ve posterioru öncekiyle birleştiren bir tür hesaplama yapmamız gerektiğini varsayıyorum, ancak kombinasyon formülünün neye benzediğinden emin değilim.

Yanıtlar:


23

Bayes güncellenmesi temel fikri o bazı veriler verilir X ve önceki faiz aşırı parametresini θ veri ve parametre arasındaki ilişki kullanılarak tarif edilir, olabilirlik fonksiyonu, sen teoremi posterior elde etmek Bayes kullanmak

p(θX)p(Xθ)p(θ)

Bu ilk veri noktasını gördükten sonra nerede, sırayla yapılabilir öncesinde θ güncellendi hale arka İçeride ISTV melerin RWMAIWi'nin ' ikinci bir veri noktası alabilir yanındaki ve kullanılmasını arka önce elde da olduğu gibi önce bir kez daha vb güncellemek için,x1 θ θθ x2θ

Sana bir örnek vereyim. Eğer ortalama tahmin etmek istediğinizi düşünün normal dağılımın ve size bilinir. Bu durumda normal-normal modeli kullanabiliriz. hiperparametreli için normal olduğunu varsayıyoruzσ 2 μ μ 0 , σ 2 0 :μσ2μμ0,σ02:

XμNormal(μ, σ2)μNormal(μ0, σ02)

Normal dağılım bir olduğu konjügat önce için normal dağılımın, önceden güncellemek için kapalı form çözümü vardırμ

E(μx)=σ2μ+σ02xσ2+σ02Var(μx)=σ2σ02σ2+σ02

Ne yazık ki, bu tür basit kapalı form çözümleri daha karmaşık sorunlar için mevcut değildir ve optimizasyon algoritmalarına ( maksimum posteriori yaklaşım kullanan nokta tahminleri için ) veya MCMC simülasyonuna güvenmeniz gerekir .

Aşağıda veri örneğini görebilirsiniz:

n <- 1000
set.seed(123)
x     <- rnorm(n, 1.4, 2.7)
mu    <- numeric(n)
sigma <- numeric(n)

mu[1]    <- (10000*x[i] + (2.7^2)*0)/(10000+2.7^2)
sigma[1] <- (10000*2.7^2)/(10000+2.7^2)
for (i in 2:n) {
  mu[i]    <- ( sigma[i-1]*x[i] + (2.7^2)*mu[i-1] )/(sigma[i-1]+2.7^2)
  sigma[i] <- ( sigma[i-1]*2.7^2                  )/(sigma[i-1]+2.7^2)
}

Sonuçları çizerseniz, yeni veriler biriktikçe posteriorun tahmini değere nasıl yaklaştığını (gerçek değer kırmızı çizgi ile işaretlenir) görürsünüz .

Normal-normal modelde sonraki adımlarda önceki güncelleme

Daha fazla bilgi edinmek için Kevin P. Murphy'nin bu slaytları ve Gaussian dağıtım belgesinin Eşlenik Bayes analizini kontrol edebilirsiniz . Kontrol edin Bayesian öncelikleri büyük örneklem büyüklüğü ile ilgisiz mi? Ayrıca Bayesian çıkarımına erişilebilir adım adım giriş için bu notları ve bu blog girişini kontrol edebilirsiniz .


Teşekkür ederim, bu çok faydalı. Bu basit örneği nasıl çözeceğiz (örneğinizin aksine bilinmeyen varyans)? Önceden N ~ (5, 4) dağılımına sahip olduğumuzu ve sonra 5 veri noktası gözlemlediğimizi varsayalım (8, 9, 10, 8, 7). Bu gözlemlerden sonra posterior ne olurdu? Şimdiden teşekkür ederim. Çok takdir etmek.
statstudent

@Kelly, varyansın bilinmediği ve ortalama olarak bilindiği veya her ikisinin de bilinmeyen konjugat öncelikleri hakkındaki Wikipedia girişinde ve cevabımın sonunda verdiğim bağlantılarda örnekler bulabilirsiniz. Hem ortalama hem de varyans bilinmiyorsa, biraz daha karmaşık hale gelir.
Tim

μσ2

4

P(θ)P(xθ)

P(θx)=θP(xθ)P(θ)P(x)

P(x)

P(θx)θP(xθ)P(θ)

Konjugat öncelikleri vakası (sıklıkla güzel kapalı formüller elde ettiğinizde)

θP(θ)P(xθ)P(θ) P(θx)

Konjugat dağılımları tablosu bazı sezgilerin oluşturulmasına yardımcı olabilir (ve kendi başınıza çalışmak için bazı öğretici örnekler verebilir).


1

Bu Bayesci veri analizi için merkezi hesaplama konusudur. Bu gerçekten ilgili verilere ve dağıtımlara bağlıdır. Her şeyin kapalı formda ifade edilebileceği basit durumlar için (örneğin, konjugat öncelikleriyle) Bayes teoremini doğrudan kullanabilirsiniz. Daha karmaşık vakalar için en popüler teknik ailesi Markov zinciri Monte Carlo'dur. Ayrıntılar için Bayesian veri analizi ile ilgili giriş kitapçığına bakınız.


Çok teşekkür ederim! Bu gerçekten aptalca bir takip sorusu ise, ama bahsettiğiniz basit durumlarda, Bayes teoremini doğrudan nasıl kullanırız? Örnek ortalamaların yarattığı dağılım ve veri noktalarının varyansı olabilirlik fonksiyonu olur mu? Çok teşekkür ederim.
statstudent

@Kelly Yine, dağılıma bağlıdır. Bkz. Örneğin en.wikipedia.org/wiki/Conjugate_prior#Example . (Sorunuzu cevapladıysam, oylama oklarının altındaki onay işaretine tıklayarak cevabımı kabul etmeyi unutmayın.)
Kodiologist
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.