θ
y1, . . . , yny= ( y1, . . . , yn)T
y1, . . . , yn| θ∼N( θ , σ2)
Veya daha tipik olarak Bayesian tarafından yazıldığı gibi,
y1, . . . , yn| θ∼N( θ , τ)
τ= 1 / σ2τ
yben
f( yben| θ,τ) = (√τ2 π) × e x p ( - τ( yben- θ )2/ 2 )
θ^= y¯
θ
θ ∼ N( a , 1 / b )
Bu Normal-Normal (bir çok cebirden sonra) veri modelinden elde ettiğimiz posterior dağılım başka bir Normal dağılımdır.
θ | y∼ N( bb + n τa + n τb + n τy¯, 1b + n τ)
b + n τbiry¯bb + n τa + n τb + n τy¯
θ | yθθ
Bununla birlikte, bunu göstermek için herhangi bir Normal veri ders kitabı örneğini kullanabilirsiniz. airquality
R içindeki veri setini kullanacağım. Ortalama rüzgar hızlarını (MPH) tahmin etme sorununu düşünün.
> ## New York Air Quality Measurements
>
> help("airquality")
>
> ## Estimating average wind speeds
>
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>
> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
>
>
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
>
> a = 12
> b = 2
>
> ## Your posterior would be N((1/))
>
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
>
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
>
> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5% 97.5%
9.958984 10.047404
Bu analizde, araştırmacı (siz) veriler + önceki bilgiler verildiğinde, ortalama rüzgar tahmininizin, 50. persentil kullanarak, hızların 10.00324 olması gerektiğini, sadece verilerdeki ortalamanın kullanılmasından daha büyük olduğunu söyleyebilirsiniz. Ayrıca 2.5 ve 97.5 miktarları kullanarak% 95 güvenilir bir aralık çıkarabileceğiniz tam bir dağıtım elde edersiniz.
Aşağıda iki referans ekliyorum, Casella'nın kısa makalesini okumanızı şiddetle tavsiye ederim. Özellikle ampirik Bayes yöntemlerini hedeflemektedir, ancak Normal modeller için genel Bayes metodolojisini açıklamaktadır.
Referanslar:
Casella, G. (1985). Ampirik Bayes Veri Analizine Giriş. Amerikan İstatistikçi, 39 (2), 83-87.
Gelman, A. (2004). Bayesci veri analizi (2. baskı, İstatistik bilimindeki metinler). Boca Raton, Fla .: Chapman & Hall / CRC.