Bayesci istatistik öğretmek için basit gerçek dünya örnekleri?


10

Bayesci istatistikleri öğretmek için bazı "gerçek dünya örnekleri" bulmak istiyorum. Bayesci istatistik, kişinin önceki bilgileri bir analize resmen dahil etmesine izin verir. Öğrencilere, analizlerine önceden bilgi ekleyen araştırmacıların bazı basit gerçek dünya örneklerini vermek istiyorum, böylece öğrenciler neden Bayesian istatistiklerini ilk etapta kullanmak isteyebileceklerinin motivasyonunu daha iyi anlayabilsinler.

Araştırmacıların resmi olarak önceki bilgileri dahil ettiği bir nüfus ortalaması, oran, regresyon vb. Tahmin etmek gibi basit gerçek dünya örneklerinden haberdar mısınız? Bayeslilerin "bilgilendirici olmayan" öncelikleri de kullanabildiklerinin farkındayım, ancak özellikle bilgilendirici önceliklerin (yani gerçek önceki bilgiler) kullanıldığı gerçek örneklerle ilgileniyorum.


Bence IQ oldukça iyi bir örnek.
hejseb

Kesinlikle bir cevap değil ama üç kez bozuk para çevirdiğinizde ve baş iki kez geldiğinde hiçbir öğrenci inanmazdı, bu kafa kuyruklardan iki kat daha muhtemeldi.Bu kesinlikle gerçek araştırma olmamasına rağmen oldukça ikna edici.
Bernhard

1
Sizinki tarafından yazılmış bu cevabı kontrol edebilirsiniz: stats.stackexchange.com/a/134385/61496
Yair Daon

Belki de sıklık olasılığı / tahmininde uygulanabilecek Bayes Kuralını ve "olasılığın" inancın bir özeti olduğu Bayes istatistiklerini mi karıştırıyorsunuz?
AdamO

Yanıtlar:


6

Bayesçi arama teorisi , denizde kayıp gemileri aramak için birçok kez uygulanan Bayesci istatistiklerin ilginç bir gerçek dünya uygulamasıdır. Başlamak için bir harita karelere bölünür. Her kareye, bilinen son konuma, istikamete, eksik zamana, akımlara vb. Dayalı olarak kaybolan damarın bulunmasına ilişkin önceden bir olasılık atanır. Ek olarak, her kareye, aslında o karede ise, su derinliği gibi şeyler. Bu dağılımlar, olumlu bir sonuç üretme olasılığı en yüksek olan harita karelerine öncelik vermek için birleştirilir - geminin olması için en muhtemel yer değil, gemiyi gerçekten bulma olasılığı en yüksek olan yer.


1
Güzel, bunlar eğlenceli kitapta Ölmeyen Teori: Bayes Kuralı'nın Enigma Kodunu Nasıl Çatladığını, Rus Denizaltılarını ve Ortaya Çıkan Muzaffer'i iki yüzyıllık tartışmadan nasıl tanımladılar . Ayrıca Turing, muammayı kırmak için bu tür bir akıl yürütme kullandı.
jpmuc

Olasılıksal ama Bayesci mi?
Andrew

5

Geleneksel açıklayıcı örnekte seri numaralardan üretim veya nüfus büyüklüğünü tahmin etmenin ilginç olduğunu düşünüyorum. Burada en fazla ayrı bir düzgün dağılım deniyorsunuz. Önceden seçiminize bağlı olarak, maksimum olasılık ve Bayes kestirimleri oldukça şeffaf bir şekilde farklılık gösterecektir.

Belki de en ünlü örnek, İkinci Dünya Savaşı sırasında Alman tanklarının üretim oranını, tank seri numarası bantlarından ve sıkça yapılan ortamda yapılan üretici kodlarından tahmin etmektir (Ruggles ve Brodie, 1947). Bayes bakış açısından bilgilendirici öncelikler ile alternatif bir analiz (Downey, 2013) tarafından ve uygunsuz bir bilgilendirici olmayan öncelikler ile yapılmıştır (Höhle ve Held, 2004). (Höhle ve Held, 2004) tarafından yapılan çalışmalar da literatürde daha önceki tedavilere daha fazla atıfta bulunmaktadır ve bu problemin bu sitede daha fazla tartışılması da vardır.

Kaynaklar:

Bölüm 3, Downey, Allen. Think Bayes: Python'da Bayesci İstatistikler. "O'Reilly Media, Inc.", 2013.

Vikipedi

Ruggles, R .; Brodie, H. (1947). "II. Dünya Savaşı'nda Ekonomik İstihbarata Ampirik Bir Yaklaşım". Amerikan İstatistik Derneği Dergisi. 42 (237): 72'de açıklanmaktadır.

Höhle, Michael ve Leonhard Held. Bir popülasyonun büyüklüğünün Bayes kestirimi. 499. Tartışma belgesi // Sonderforschungsbereich 386 der Ludwig-Maximilians-Universität München, 2006.


3

Spressio -Temporal Data , Wiley için Cressie & Wickle İstatistiklerinde , 1968'de kaybolan bir denizaltı olan USS Scorpion'un (bayes) araştırması hakkında güzel bir hikaye var. Bu hikayeyi öğrencilerimize anlatıyor ve basitleştirilmiş) bir simülatör kullanarak arama yapın .

Benzer örnekler, kayıp uçuş MH370'in hikayesi etrafında inşa edilebilir; Davey ve ark., MH370 Arayışında Bayesian Yöntemleri , Springer- Verlag'a bakmak isteyebilirsiniz .


1

θ

y1,...,yny=(y1,...,yn)T

y1,...,yn|θ~N-(θ,σ2)

Veya daha tipik olarak Bayesian tarafından yazıldığı gibi,

y1,...,yn|θ~N-(θ,τ)

τ=1/σ2τ

yben

f(yben|θ,τ)=(τ2π)xexp(-τ(yben-θ)2/2)

θ^=y¯

θ

θ~N-(bir,1/b)

Bu Normal-Normal (bir çok cebirden sonra) veri modelinden elde ettiğimiz posterior dağılım başka bir Normal dağılımdır.

θ|y~N-(bb+nτbir+nτb+nτy¯,1b+nτ)

b+nτbiry¯bb+nτbir+nτb+nτy¯

θ|yθθ

Bununla birlikte, bunu göstermek için herhangi bir Normal veri ders kitabı örneğini kullanabilirsiniz. airqualityR içindeki veri setini kullanacağım. Ortalama rüzgar hızlarını (MPH) tahmin etme sorununu düşünün.

> ## New York Air Quality Measurements
> 
> help("airquality")
> 
> ## Estimating average wind speeds
> 
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>

resim açıklamasını buraya girin

> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
> 
> 
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
> 
> a = 12
> b = 2
> 
> ## Your posterior would be N((1/))
> 
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
> 
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
> 

resim açıklamasını buraya girin

> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5%     97.5% 
9.958984 10.047404 

Bu analizde, araştırmacı (siz) veriler + önceki bilgiler verildiğinde, ortalama rüzgar tahmininizin, 50. persentil kullanarak, hızların 10.00324 olması gerektiğini, sadece verilerdeki ortalamanın kullanılmasından daha büyük olduğunu söyleyebilirsiniz. Ayrıca 2.5 ve 97.5 miktarları kullanarak% 95 güvenilir bir aralık çıkarabileceğiniz tam bir dağıtım elde edersiniz.

Aşağıda iki referans ekliyorum, Casella'nın kısa makalesini okumanızı şiddetle tavsiye ederim. Özellikle ampirik Bayes yöntemlerini hedeflemektedir, ancak Normal modeller için genel Bayes metodolojisini açıklamaktadır.

Referanslar:

  1. Casella, G. (1985). Ampirik Bayes Veri Analizine Giriş. Amerikan İstatistikçi, 39 (2), 83-87.

  2. Gelman, A. (2004). Bayesci veri analizi (2. baskı, İstatistik bilimindeki metinler). Boca Raton, Fla .: Chapman & Hall / CRC.


1

Bayesian yöntemlerinin kesinlikle gerekli olduğuna inandığım bir araştırma alanı, optimum tasarımdır.

xβx

xβββx , ancak

  • n=0β^

  • β^

  • β=1β^=5xβ=5x 'ler).

  • Bu, belirsizliğini dikkate almaz.β

xx

xβ

βx

x


1

Son zamanlarda bu soruyu düşünüyordum ve sanırım bayesinin mantıklı olduğu, daha önceki bir olasılıkla: klinik testin olasılık oranı.

Örnek şu olabilir: günlük uygulama koşulları altında idrar dipslidinin geçerliliği (Family Practice 2003; 20: 410-2). Fikir, idrar dipslidinin pozitif bir sonucunun idrar enfeksiyonu tanısında ne ima ettiğini görmektir. Olumlu sonucun olasılık oranı:

LR,(+)=test+|'H+test+|'H-=Sensbenbbenlbenty1-specbenfbencbenty
'H+'H-

ÖR,(+|test+)=LR,(+)xÖR,(+)
ÖR,ÖR,(+|test+)ÖR,(+)

LR,(+)=12.2LR,(-)=0.29

p+=2/3p+|test+=0.96p+|test-=0,37

Burada test enfeksiyonu tespit etmek için iyidir, ancak enfeksiyonu atmak için iyi değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.