Genellikle bilgisiz veya öznel öncelikler kullandığımızda yorumda bayes çerçevesi nasıl daha iyidir?


18

- bu veriler verilen bir parametre olasılığını hesaplar çünkü çoğu zaman, (frequentist üzerinden) Bayesian çerçeve yorumlanmasında büyük bir üstünlüğe sahip olduğunu ileri sürülmektedir yerine p ( x | İçeride ISTV melerin RWMAIWi'nin ) frequentist çerçevesindeki gibi . Çok uzak çok iyi.p(θ|x)p(x|θ)

Ancak, temel aldığı tüm denklem:

p(θ|x)=p(x|θ).p(θ)p(x)

2 nedenden dolayı bana biraz şüpheli görünüyor:

  1. Birçok makalede, genellikle bilgilendirici olmayan öncelikler (tekdüze dağılımlar) kullanılır ve daha sonra sadece , böylece bayesliler sık ​​sık elde edilenlerle aynı sonucu alırlar - öyleyse yorumda bayes çerçevesi nasıl daha iyi olur, bayes posterior ve frekansçıların aynı dağılımlar ne zaman? Sadece aynı sonucu verir.p(θ|x)=p(x|θ)

  2. Bilgilendirici öncelikler kullanırken, farklı sonuçlar elde edersiniz, ancak bayes, önceki öznelden etkilenir, bu nedenle tüm , öznel sektöre de sahiptir.p(θ|x)

Bir başka deyişle, tüm argüman daha yorumlanmasında iyi olma p ( x | θ ) bir varsayıma dayanmaktadır p ( θ ) , bu sadece bir olduğunu tür normalde olmadığı, "gerçek" taşımaktadır başlangıç ​​noktasını bir şekilde MCMC'yi çalıştırmayı seçiyoruz, bir varsayım, ama bu gerçekliğin bir tanımı değil (sanırım tanımlanamaz).p(θ|x)p(x|θ)p(θ)

Peki bayezinin yorumda daha iyi olduğunu nasıl tartışabiliriz?


4
(1) sonucu yanlış olduğu için şüpheli görünüyor: Bilgisiz önceliklere sahip Bayes sonuçları mutlaka sıkça yapılan sonuçlarla aynı değildir . Aslında, pek çok durumda "bilgisiz bir öncekinin" ne olduğu konusunda bile bir anlaşma yok gibi görünüyor! (2) aynı zamanda tartışmalı bir durumdur çünkü sıkça yapılan bir analizde yapılan her varsayımın öznel olmadığını varsayar - ama durum böyle değildir. Son olarak, "yorumda daha iyi" ile tam olarak ne demek istiyorsun? Sorunuz bunun tanımı olmadan belirsiz.
whuber

1
Whuber'ın yorumuna ek olarak, Bayes'in sık sık olmaktan daha iyi olmasının genel bir nedeni yok , bu yüzden argüman. Bazen Bayes anlamlı sonuçlar verir ve bazen frekansçı yol daha iyidir. Bununla birlikte, uygulanan alanda, kişinin çok farklı sonuçlar alması için hiçbir neden olmamalıdır. Felsefi açıdan bakıldığında, Bayes kesinlikle güçlüdür, ancak hepimizin bildiği gibi, teori ve pratik, bazen büyük ölçüde farklılık gösterir. Ayrıca, ilk paragrafınız hakkında biraz endişeliyim. Bana bağlı bir Bayesli olduğun anlaşılıyor (bunda yanlış bir şey yok.).
suncoolsu

Başlık olmamalı uninformative or *objective* priorsmı? Öncelikler subjectivetam olarak bilgilendirici önceliklerdir.
javadba

Yanıtlar:


15

Daha önce kaydedilmiş olan mükemmel yanıtlardan daha dar bir yanıt vermek ve yorumlamadaki avantaja odaklanmak için - a, örneğin "% 95 güvenilir aralık" ın Bayes yorumu, gerçek parametre değerinin aralık% 95'e eşittir. Örneğin, "% 95 güven aralığı" nın iki yaygın frekans yorumundan biri, sayısal olarak ikisi aynı olsa bile, uzun vadede, prosedürü birçok kez gerçekleştirecek olsaydık, aralık gerçek değeri% 95'e yakınlaşacaktı. Birincisi sezgisel, ikincisi değil. Bir yöneticiye "Güneş panellerimizin 25 yılda% 20'den az düşme olasılığı% 95" diyemeyeceğiniz bir zaman açıklamayı deneyin, bunun yerine "

Alternatif bir frekansçı yorumlama "Veriler oluşturulmadan önce, uyguladığım prosedürü kullanarak hesaplayacağım zaman aralığının tamamen gerçek parametre değerinin altına düşme şansı% 5 idi. Ancak, şimdi verileri topladığımız için, biz böyle bir açıklama yapamayız çünkü öznellikçi değiliz ve olasılık, gerçek parametre değerinin tamamen altında olup olmamasına bağlı olarak 0 veya 1'dir. " Bu, denetçilerle ve bir garanti rezervi hesaplanırken yardımcı olacaktır. (Aslında bu tanımı makul buluyorum, genellikle kullanışlı olmasa da; sezgisel olarak anlamak da kolay değil ve özellikle bir istatistikçi değilseniz.)

Her iki frekansçı yorum da sezgisel değildir. Bayesian versiyonu. Böylece Bayesci yaklaşımın “yorumda büyük avantaj” olduğu söylenebilir.


Anti-frekansçı argümanla ilgili sorunum, prosedürü bir cevap olarak tanımlamak için çok fazla çaba göstermesidir. Aynı denemeyi yorumlamada kendiniz deneyin, ancak sonuçlardan hangi sonuca ulaşacağınızı deneyin. Bir frekansçı ve bir Bayesci tarafından verilen sonuçları duymak temelinde tam olarak nasıl farklı davranırdınız ? Gerçekte, ikisini de anladığınızda hala aynı şekilde davranacaksınız. "En iyisi verinin vermiş olduğu güveni esas alarak böyle davranmak" olduğunu açıklamak için prosedür seviyesine gitmeye gerek yoktur.
PascalVKooten

Ayrıca, tanımı gereği, bayes davasında daha fazla açıklama yapmanız gerekecektir, çünkü sadece “verilerin bize söylediği şey” değil, aynı zamanda öncekinin hangi bilgileri içerdiğine de sahipsiniz! Bayesyalılar uzun süredir sık ​​sık bir açıklama yapma eğilimindedirler, ancak daha önce ne seçtiklerini, neden bir önceliği ve özellikle bu önceliği seçtiklerini açıklamaya girmezler.
PascalVKooten

Son noktanıza kısmen katılmıyorum. Örnek olarak, bir önceki işimde çok, çok pahalı ekipman parçaları üzerinde güvenilirlik analizi yaparken, önceki güvenilirlik analizimizin sonuçlarını, "eşdeğer numune boyutu" açısından küçültülmüş olarak yeni bir önceliğimiz olarak ele aldık. gerçek dünyanın durağanlığını ve tasarımdaki ufak değişiklikleri vb. göz önünde bulundurun. Ve gerçekten, Bayesci istatistiklerin hepsi verilerinizi önceden güncellemeyle ilgilidir; klasik istatistikler "güncellemez", bu nedenle aynı sonuçları yalnızca bazı istisnalar dışında önceliğiniz düzse elde edersiniz.
jbowman

Sadece veri kümelerini birleştirip başka bir analiz yapardım ... bir öncekine gerek yok. Önceki gerçek verilerden daha iyi bir öneri yoktur: "gerçek" bir veri tabanlı posterior elde edersiniz.
PascalVKooten

Eh, devam eden küçük tasarım değişiklikleri ve mfg olduğunu bildiğimiz için, yeni önceliğiniz için tam olarak önceki posterior'u istemeyebilirsiniz. süreç de evrim geçiriyordu ve gelecekteki veriler için önceden% 100 bilgilendirici olmuyordu. Çalışma zamanı ile ilgili hususlar da olabilir. Ama genel olarak iyi bir noktaya değindin, bana öyle geliyor.
jbowman

13

p(θ|x)p(x|θ)p(x|θ)p(θ|x)

Bilgilendirici önceliklerin mutlaka öznel olmadığını unutmayın, örneğin, bazı fiziksel sistemlerin ön bilgisinin ölçüm birimlerinden bağımsız olması gerektiğini (esasen keyfi oldukları için) dönüşüm grupları fikrine yol açmasının öznel bilgi olduğunu düşünmem. ve "minimal düzeyde bilgilendirici" öncelikler.

Sübjektif bilgiyi görmezden gelmenin en önemli tarafı, uzman bilgisini görmezden geldiğiniz için sisteminizin en iyi durumda olabileceğidir, bu yüzden öznellik mutlaka kötü bir şey değildir. Örneğin, genellikle motive edici bir örnek olarak kullanılan olağan "bir madalyonun önyargısını çıkar" probleminde, veriler gelmeden önce üniforma ile nispeten yavaş öğreneceksiniz. Ancak tüm önyargıların eşit derecede makul bir varsayım olduğu düşünülüyor mu? Hayır, hafif önyargılı bir madeni para veya tamamen önyargılı bir para (iki kafa veya iki tal) yapmak kolaydır, bu nedenle bu varsayımı analizimize öznel bir öncekiyle inşa edersek, önyargı aslında.

Frekansçı analizler sıklıkla öznel unsurlar da içerir (örneğin, p-değeri 0.05'ten küçükse sıfır hipotezini reddetme kararı, bunu yapmak için mantıklı bir zorlama yoktur, sadece yararlı olduğu kanıtlanmış bir gelenektir). Bayesci yaklaşımın avantajı, öznelliğin örtük bırakmak yerine hesaplamada açık hale getirilmesidir.

Günün sonunda, bu "kurslar için atlar" meselesidir, araç kutunuzda her iki araç setine sahip olmanız ve eldeki görev için en iyi aracı kullanmaya hazır olmanız gerekir.


6

Bayesci çerçeve, frekansçılara göre büyük bir avantaja sahiptir, çünkü yapılacak doğru dağıtım varsayımlarını bilmek açısından bir "kristal küre" ye bağlı değildir. Bayesian yöntemleri, sahip olduğunuz bilgileri kullanmaya ve bu bilgiyi olasılık dağılımına nasıl kodlayacağınızı bilmenize bağlıdır.

Bayesian yöntemlerini kullanmak temel olarak olasılık teorisini tüm gücüyle kullanmaktır. Bayes teoremi, olasılık teorisinin klasik ürün kuralının bir ifadesinden başka bir şey değildir:

p(θx|I)=p(θ|I)p(x|θI)=p(x|I)p(θ|xI)

p(x|I)0I

Şimdi, Bayes teoreminin şüpheli olduğunu düşünüyorsanız, mantıksal olarak, ürün kuralının da şüpheli olduğunu düşünmelisiniz. Burada , Cox teoremine benzer şekilde, ürün ve toplam kurallarını türeyen tümdengelimsel bir argüman bulabilirsiniz . Gerekli varsayımların daha açık bir listesini burada bulabilirsiniz .

Bildiğim kadarıyla, frekansçı çıkarım mantıksal bir çerçeve içindeki bir dizi temele dayanmaz. Kolmogorov olasılık aksiyomlarını kullandığı için olasılık teorisi ile istatistiksel çıkarım arasında herhangi bir bağlantı görünmemektedir. Sıklıkla izlenecek bir prosedüre yol açan herhangi bir aksiyom yoktur. İlkeler ve yöntemler (maksimum olasılık, güven aralıkları, p-değerleri, vb.) Vardır ve iyi çalışırlar, ancak belirli sorunlara karşı yalıtılmış ve uzmanlaşma eğilimindedirler. Bence sıkça kullanılan yöntemler, en azından katı bir mantıksal çerçeve açısından, temellerinde en iyi belirsizdir.

1θ

2

Düzgün bir öncekinin kullanılması, olasılığın öncekine göre daha keskin olduğu durumlarda yapmak için genellikle uygun bir yaklaşımdır. Bazen bir önceliği kurmak ve düzgün bir şekilde kurmak için çaba harcamaya değmez. Benzer şekilde Bayesian istatistiklerini MCMC ile karıştırmak gibi bir hata yapmayın. MCMC, guassian quadratre ile aynı ve Laplace yaklaşımına benzer bir sınıfta bir entegrasyon algoritmasıdır. Tüm integrallerinizi yapmak için algoritmanın çıktısını tekrar kullanabileceğinizden (posterior ortalamalar ve varyanslar integrallerdir) ve Laplace'ın biraz daha genel olması nedeniyle büyük bir örneğe veya bir posteriorda iyi yuvarlatılmış tepe (Laplace olsa daha hızlıdır).


3

μ=0) regresyon katsayısı üzerine yerleştirilmiş, her şeyin eşit olduğu bilgisini kodlayarak, katsayıların daha düşük büyüklüklere sahip olduğu çözümleri tercih ediyoruz. Bunun amacı, nesnel işlevi en üst düzeye çıkaran ancak sorunumuzun belirli bağlamında anlamlı olmayan çözümler bularak bir veri kümesinin fazla takılmasını önlemektir. Bir anlamda, istatistiksel modele belirli bir alan hakkında bazı ipuçları vermek için bir yol sağlarlar.

Ancak bu (bence) Bayesci metodolojilerin en önemli yönü değildir. Bayesian yöntemleri, verilerin nasıl ortaya çıktığı konusunda eksiksiz bir "öykü" sağlamaları bakımından üretkendir. Böylece, sadece kalıp bulucular değil, eldeki durumun tüm gerçekliğini de hesaba katabilirler. Örneğin, bir metin belgesinin nasıl olacağına dair tam üretken bir hikaye sağlayan LDA'yı (gizli Dirichlet tahsisi) düşünün, şöyle bir şey olur:

  1. Belirli konuların bir arada meydana gelme olasılığına bağlı olarak bazı konular karışımını seçin; ve
  2. Seçilen konulara göre koşullandırılmış kelime dağarcığından bazı kelime kümeleri seçin.

Bu nedenle, model, alandaki nesnelerin (burada, metin belgeleri) ve nasıl oluşturulduklarının çok spesifik bir anlayışına dayanmaktadır; bu nedenle, geri aldığımız bilgiler doğrudan sorun alanımıza göre düzenlenir (konuların verildiği kelimelerin olasılıkları, konuların birlikte bahsedilme olasılıkları, konu içeren belgelerin olasılıkları ve ne ölçüde vb.). Bayes Teoreminin bunu yapmak için gerekli olması neredeyse ikincil, bu nedenle küçük şaka, "Bayes bir Bayesci ve Mesih bir Hıristiyan olmaz."

Kısacası, Bayesci modellerin tümü etki alanı nesnelerini olasılık dağılımları kullanarak titizlikle modellemekle ilgilidir; bu nedenle, başka türlü mevcut olmayacak bilgiyi basit bir ayrımcı teknikle kodlayabiliriz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.