Kanser oranı ile ilgili modelleme ile ilgili bir örnek göstermek istiyorum (Johnson ve Albert 1999'da olduğu gibi). İlgilendiğiniz birinci ve üçüncü öğeye dokunacaktır.
Dolayısıyla sorun, çeşitli şehirlerdeki kanser oranlarını tahmin etmektir. Çeşitli şehirler insanların sayısının verilere sahip Say kanseri ile ölenlerin sayısı ve . Diyelim ki kanser oranlarını tahmin etmek istiyoruz . Onları modellemenin çeşitli yolları vardır ve her biriyle ilgili sorunlar gördüğümüz gibi. Heirachical bayes modellemesinin bir sorunun nasıl üstesinden gelebileceğini göreceğiz.
1. Bir yol, tahmini ayrı olarak yapmaktır, ancak seyrek veri probleminden muzdarip olacağız ve düşük için olduğu gibi oranların göz ardı edilmesi .Nixiθi
Ni
2. Seyrek veri sorununu yönetmek için bir yaklaşım daha tüm şehirler için aynı kullanmak ve parametreleri bağlamak olacaktır, ancak bu aynı zamanda çok güçlü bir varsayımdır.
3. Peki yapılabilirdi tüm 'ın bir şekilde benzer değil, aynı zamanda şehir belli varyasyonları ile bulunmaktadır. Böylece tüm model, ortak bir dağıtımdan şekilde modellenebilir . Diyelim ki ve
Tam bir ortak dağıtım burada . Çıkarım yapmalıyızθi
θiθixi∼Bin(Ni,θi)θi∼Beta(a,b)
η = ( a , b ) η θ i η θ ip(D,θ,η|N)=p(η)∏Ni=1Bin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηverilerden. Bir sabite kenetlenirse, bilgi 's arasında akmaz ve koşullu olarak bağımsız olurlar. Ancak bilinmeyen muamelesi yaparak, daha az veriye sahip şehirlerin daha fazla veriye sahip şehirlerden istatistiksel güç almasına izin veririz.
Ana fikir hiperparametrelerdeki belirsizliği modellemek için daha bayesci ve önceliklere öncelik vermektir. Bu, bu örnekte arasındaki etki akışına izin verir .θiη
θi