Önce bir konjugatın ne olduğunu açıklayayım . Daha sonra, spesifik örneğinizi kullanarak Bayesian analizlerini açıklayacağım. Bayes istatistikleri şu adımları içerir:
- Bir parametre hakkındaki öznel inançlarınızı içeren önceki dağıtımı tanımlayın (örnekte ilgilendiğiniz parametre, sol tarafların oranıdır). Birincisi "bilgisiz" veya "bilgilendirici" olabilir (ancak hiçbir bilgisi olmayan bir öncelik yoktur, burada tartışmaya bakınız ).
- Veri toplamak.
- Bir posterior dağılım elde etmek için önceki dağılımınızı Bayes teoremini kullanarak verilerle güncelleyin . Posterior dağılım, verileri gördükten sonra parametre hakkındaki güncellenmiş inançlarınızı temsil eden bir olasılık dağılımıdır.
- Posterior dağılımını analiz eder ve özetler (ortalama, medyan, sd, quantiles, ...).
Tüm bayes istatistiklerinin temeli, Bayes teoremidir.
posterior∝prior×likelihood
Senin durumunda, ihtimal binom. Ön ve arka dağılım aynı ailede ise , önceki ve arka konjugat dağılımları olarak adlandırılır . Beta dağılımı önceden bir konjugattır, çünkü posterior aynı zamanda bir beta dağılımıdır. Beta dağılımının binom olasılığının eşlenik ailesi olduğunu söylüyoruz. Konjugat analizleri uygundur ancak nadiren gerçek dünya problemlerinde ortaya çıkar. Çoğu durumda, posterior dağılımın sayısal olarak MCMC yoluyla bulunması gerekir (Stan, WinBUGS, OpenBUGS, JAGS, PyMC veya başka bir program kullanılarak).
Eğer önceki olasılık dağılımı 1 ile bütünleşmezse, daha önce uygunsuz olarak adlandırılır , 1 ile bütünleşirse buna uygun bir öncelik denir . Çoğu durumda, uygunsuz bir önceki Bayesian analizleri için büyük bir sorun teşkil etmez. Posterior dağılım olsa da uygun olmalıdır , yani posterior 1 ile bütünleşmelidir.
Bu kurallar, doğrudan Bayesian analiz prosedürünün niteliğinden kaynaklanmaktadır:
- Öncelikle bilgilendirici değilse, posterior verilerle belirlenir (poster veriye dayalı)
- Öncelik bilgilendirici ise, poster öncekilerin ve verilerin bir karışımıdır.
- Ön bilgi ne kadar bilgilendirici olursa, inancınızı "değiştirmeniz" gerekir, böylece konuşursunuz çünkü arkadakiler önceki bilgilerden çok etkilenir.
- Çok fazla veriye sahipseniz, veriler posterior dağılıma hükmedecektir (öncekileri ezeceklerdir)
Beta dağıtımı için bazı olası "bilgilendirici" ve "bilgi vermeyen" önceliklerin mükemmel bir incelemesi bu yazıda bulunabilir .
Önceki beta sürümünüzün burada solakların oranıdır. Önceki parametreleri ve belirtmek için , beta dağılımının ortalamasını ve varyansını bilmek yararlıdır (örneğin, önceden bir belirli ortalama ve varyansa sahip olmak istiyorsanız). Ortalama, . Bu nedenle, olduğunda, ortalama . Beta dağılımının varyansı . Şimdi, uygun olan şey ve düşünebilmenizdirBeta(πLH|α,β)πLHαβπ¯LH=α/(α+β)α=β0.5αβ(α+β)2(α+β+1)αβαβneq=α+βBetbir(πLH|α=1,β=1)πL* Hdaha önce gözlendiği gibi (sözde) veriler, yani solaklar ve sağa sola n büyüklüğünde (sözde) bir örnekten . dağıtım takımları (her değerindedir eşit muhtemel) ve iki insanlar gözlenen sahip eşdeğerdir bunlardan biri solak, diğeri sağ elini kullanıyor.αβneq=α+βBeta(πLH|α=1,β=1)πLH
Posterior beta dağılımı, basitçe olup , burada , numunenin büyüklüğüdür ve , numunedeki solakların sayısıdır. Bu yüzden nin arka ortalaması . Bu yüzden sadece eklemek posterior beta dağılımının parametrelerini bulmak için sol akrep-yelkovan ve hakkı akrep-yelkovan . Arka varyansBeta(z+α,N−z+β)NzπLH(z+α)/(N+α+β)zαN−zβ(z+α)(N−z+β)(N+α+β)2(N+α+β+1). Bilgilendirici bir önceliğin, posterior dağılımın daha küçük bir değişkenliğine yol açtığını unutmayın (aşağıdaki grafikler, noktayı güzel bir şekilde göstermektedir).
Sizin durumunuzda, ve ve öncekiniz biçimsiz olan üniformadır, yani . Posterior dağılımınız bu nedenle . Arka ortalama . İşte veri önceliğini, verinin olasılığını ve posterioru gösteren bir grafik.z=2N=18α=β=1Beta(3,17)π¯LH=3/(3+17)=0.15
Önceden yaptığınız dağılımın bilgilendirici olmadığı için posterior dağılımınızın tamamen verilerden kaynaklandığını görüyorsunuz. Ayrıca, posterior dağılım için en yüksek yoğunluk aralığı (HDI) da çizilmiştir. Posterior dağılımınızı 2B havzaya koyduğunuzu ve dağılımın% 95'i su hattının üzerine gelene kadar su doldurmaya başladığınızı hayal edin. Su hattının posterior dağılımla kesiştiği noktalar% 95 -HDI'yi oluşturur. HDI içindeki her nokta, dışındaki herhangi bir noktadan daha yüksek bir olasılığa sahiptir. Ayrıca, HDI her zaman arka dağılımın zirvesini (yani modu) içerir. HDI, arka kuyrukların her% 2,5'inin hariç tutulduğu% 95'lik güvenilir bir aralıktan farklıdır ( buraya bakınız ).
İkinci göreviniz için, nüfusun% 5-20'sinin sol tarafların dikkate alındığı bilgisini birleştirmeniz isteniyor. Bunu yapmanın birkaç yolu var. En kolay yolu, önceki beta dağılımı bir ortalamaya sahip olmalıdır yani ortalamasıdır ve . Ancak önceki beta dağılımının ve seçilmesi nasıl yapılır ? İlk önce, önceki dağılımın ortalamasının, eşdeğer örneklem büyüklüğünde bir sahte örneklemden olmasını istersiniz . Daha genel olarak, önceki, yalancı örneklem büyüklüğü olan bir ortalama sahip olmak istiyorsanız , karşılık gelen0.1250.050.2αβ0.125neqmneqαve değerleri: ve . Şimdi yapmanız gereken tek şey, önceki bilgileriniz hakkında ne kadar güvende olduğunuzu belirleyen sözde örneklem büyüklüğü seçmektir . Diyelim ki önceki bilgilerinizden çok ve . Önceki dağıtımınızın parametreleri, sırasıyla ve . Posterior dağılım , ortalama olarak yaklaşık ; bu, pratik olarak önceki ortalaması ile aynıdır.βα=mneqβ=(1−m)neqneqneq=1000α=0.125⋅1000=125β=(1−0.125)⋅1000=875Beta(127,891)0.1250.125. Önceki bilgi posterior'a baskın geliyor (aşağıdaki grafiğe bakınız):
Önceki bilgilerden daha az emin iseniz , önceki beta dağıtımınız için ve sonuç veren sözde örneğinizin değerini . Arka dağılım, ortalama olarak yaklaşık olan dır . Arka ortalama şimdi verilerinizin ortalamasına yakındır ( ) çünkü veriler . İşte durumu gösteren grafik:neq10α=1.25β=8.75Beta(3.25,24.75)0.1160.111
Önceki bilgileri içeren bir daha gelişmiş bir yöntem olduğunu söylemek olurdu hesabıyla önceki beta dağılımının quantile hakkında olmalıdır ve quantile hakkında olmalıdır . Bu,% 95'inizin, nüfus içinde kalanların oranının% 5 ila% 20 arasında olduğundan emin olduğunuzu söylemenize eşdeğerdir. R paketindeki işlev , bu miktarlara karşılık gelen bir beta dağılımının karşılık gelen ve değerlerini hesaplar . Kod0.0250.050.9750.2beta.select
LearnBayes
αβ
library(LearnBayes)
quantile1=list(p=.025, x=0.05) # the 2.5% quantile should be 0.05
quantile2=list(p=.975, x=0.2) # the 97.5% quantile should be 0.2
beta.select(quantile1, quantile2)
[1] 7.61 59.13
İstenilen özelliklere ve parametrelerinin olduğu bir beta dağılımının göründüğü görülüyor . Önceki ortalama, bu, verilerinizin ortalamasına yakındır ( ). Yine, bu önceki dağıtım, yaklaşık eşdeğer numune büyüklüğüne sahip sahte bir örneklem bilgisini içerir . Posterior dağılımı olan bir ortalama oldukça bilgi verici kullanarak önceki analizin ortalaması ile karşılaştırılabilir önceden. İşte karşılık gelen grafik:α=7.61β=59.137.61/(7.61+59.13)≈0.1140.111neq≈7.61+59.13≈66.74Beta(9.61,75.13)0.113Beta(125,875)
Ayrıca Bayesian akıl yürütme ve basit analizlerin kısa ama iyi bir genel bakış için bu referansa bakınız . Konjugat analizleri için, özellikle de binom veriler için daha uzun bir giriş burada bulunabilir . Bayes düşüncesine genel bir giriş burada bulunabilir . Baysian istatistiklerinin özellikleriyle ilgili daha fazla slayt burada .