Bir Bayesian yaklaşımının daha basit, daha pratik veya daha uygun olduğu durumların listesi


63

İstatistikler içerisinde Bayesliler ile sık görüşmeler arasında birçok tartışma yaşandı. Genelde bunları yerine koyulma buluyorum (her ne kadar öldüğünü düşünüyorum). Öte yandan, konuyla ilgili tamamen pragmatik bir görüşe sahip birkaç kişiyle tanıştım, bazen sıkça bir analiz yapmanın daha uygun olduğunu ve bazen bir Bayesian analizini yürütmenin daha kolay olduğunu söyledim. Bu bakış açısını pratik ve canlandırıcı buluyorum.

Bana böyle davaların bir listesinin olmasının yararlı olacağı aklıma geldi. Çünkü çok fazla istatistiksel analiz var ve sıkça bir analiz yapmanın normalde daha pratik olduğunu varsaydığım için (WinBUGS’da bir t-testini kodlamak, R’de frekansçı tabanlı bir versiyonun gerçekleştirilmesi için gerekli olan tek bir fonksiyon çağrısından önemli ölçüde daha fazladır) örneğin), bir Bayesian yaklaşımının sıkça yaklaşan bir yaklaşımdan daha basit, daha pratik ve / veya daha uygun olduğu durumların bir listesine sahip olmak güzel olurdu.


(İlgilenmediğim iki cevap: 'her zaman', ve 'asla'. İnsanların güçlü fikirleri olduğunu anlıyorum, ancak lütfen onları burada yayınlamayın. Bu konu küçük kavgalar için bir yer haline gelirse, muhtemelen sileceğim Buradaki amacım, işi bilen bir analistin öğütmek için bir balta değil, faydalı olacağı bir kaynak geliştirmektir.)

İnsanlara birden fazla vaka önerebilirler, ancak lütfen her bir durumu ayrı ayrı değerlendirmek (oylanmak / tartışmak) için ayrı cevaplar kullanın. Cevaplar şöyle sıralamalıdır: (1) durumun niteliği nedir ve (2) bu durumda Bayesci yaklaşımın neden daha basit olduğunu. Analizin nasıl yapılacağını ve Bayesian sürümünün neden daha pratik olduğunu gösteren bazı kodlar (WinBUGS’ta söylenebilir) ideal olacaktır, ancak bence çok zahmetli olur. Kolayca yapılabilir eğer takdir ediyorum, ama lütfen nedenini de ekleyin .

Son olarak, bir yaklaşımın diğerinden daha basit olmasının ne demek olduğunu tanımlamadığımı kabul ediyorum. Gerçek şu ki, bir yaklaşımın diğerinden daha pratik olması için ne anlama geleceği konusunda tam olarak emin değilim. Farklı önerilere açığım, tartışacağınız durumda bir Bayesian analizinin neden daha uygun olduğunu açıkladığınızda yorumunuzu belirtin.


7
Çok seviyeli modelleme, özellikle kavramsal olarak, bayesyen için kesinlikle daha kolaydır.
Olasılıksal

Sorgulayıcı bundan hoşlanmayabilir, ancak çıkarım ya da modelleme yöntemlerinin gerçekte ne yaptığını ve bunları nasıl yorumlayacağınızı gerçekten düşünmeden ve anlayabilmenin bir yolu yoktur. Farklı hedeflere ulaştıklarında daha basit olanı aramak çok mantıklı değildir.

1
Ne yapmaya çalıştığınızı ve analizlerin nasıl yürüdüğünü açık bir şekilde düşünmenizi tavsiye edebileceğim bir tavsiye. Bu tavsiyeyi kendim verdim ;-). Ayrıca Bayes ve sık görüşmelerin analizlerinin olasılık doğası hakkında farklı varsayımlarda bulunduğunu da biliyorum. Bununla birlikte, soruda belirttiğim gibi, yeterince benzer oldukları ve 1'in daha uygun olduğu zamanları olduğunu söyleyen birkaç kişiyle (yani, doktora konularını oldukça iyi anlayan istatistikler) tanıştım. Diğer cevaplar, bu tür örneklerin verilebileceğini göstermektedir. Tanıdığın başka vakaları görmeyi çok isterim.
gung - Reinstate Monica

Merak ediyorum - "frekans analizi daha pratiktir" derken yazılımdan söz ediyor musunuz - örneğin lm ()R'yi kullanmak daha kolay kullanmak gibi mi? Yoksa başka bir şey mi var?
olasılık,

@probabilityislogic, aslında. Benim t.test()örneğim WinBUGS’da bir Bayesian t testi yapmak yerine, daha fazla kod gerektiren bir durum. Belki de "daha pratik" yerine, "kolay" demeliydim.
gung - Monica'yı yeniden yerleştirme

Yanıtlar:


26

(1) Olabilirlik fonksiyonunun anlaşılmaz olduğu bağlamlarda (en azından sayısal olarak), Bayesian yaklaşımının, yaklaşık Bayesian Hesaplama (ABC) aracılığıyla kullanılması, kompozit olabilirlik gibi bazı sık rastlanan rakipler üzerinde zemin kazanmıştır ( 1 , 2 ). veya ampirik olabilirlik, çünkü uygulanması daha kolay olma eğilimindedir (zorunlu olarak doğru değil). Bu nedenle, ABC kullanımı, biyoloji , genetik ve ekoloji gibi zorlu ihtimallerle karşılaşmanın yaygın olduğu alanlarda popüler hale gelmiştir . Burada bir örnek okyanustan bahsedebiliriz.

Bazı inatçı olabilirlik örnekleri

  • N

  • 1000+


1
Bunlar harika! Onları 2 cevaba böler misiniz (böylece sizi iki kez yükseltebilirim ;-), ve sadece bir, tipik (oyuncak) örnek verebilir miyim? Teşekkürler.
gung - Reinstate Monica

2
@Procrastinator Bazı bağlamlarda olasılığın neden anlaşılmaz olduğu konusunda biraz detay verebilir misiniz? Biyoloji, genetik ve ekolojiden bahsettiğiniz göz önüne alındığında, bunun parametreler arasındaki karmaşık bağımlılıkla bağlantılı olduğunu hayal ediyorum. Bunun özellikle Bayesian analizine aşina olmayan insanlar için yararlı olacağını düşünüyorum. Teşekkürler
Antoine Vernet

15

Bayesian yazılımı geliştikçe, "uygulaması daha kolay" sorunu tartışılmaz hale geliyor. Bayesian yazılımı daha kolay ve daha kolay formlarda paketleniyor. Konuyla ilgili son bir vaka, Bayesçi tahmin t testinin yerini aldı . Aşağıdaki web sitesi makale ve yazılıma bağlantılar sağlar: http://www.indiana.edu/~kruschke/BEST/

Makalenin tanıtımından bir alıntı:

... bazı insanlar NHST ve Bayesian yöntemlerinden çıkan sonuçların iki grubun karşılaştırılması gibi basit durumlarda aynı fikirde olduğu izlenimine sahip: “Dolayısıyla, eğer ilgilendiğiniz ana soru basitçe teste uygun bir biçimde ifade edilebilirse, tam Bayesian makinelerini bu kadar basit bir soruna denemeye ve uygulamaya gerçekten gerek yok ”(Brooks, 2003, s. 2694). Bu makale, bunun aksine, Bayesian parametre tahmininin NHST t testinden çok daha zengin bilgi sağladığını ve sonuçlarının NHST t testinin sonuçlarından farklı olabileceğini göstermektedir. Bayesian parametre tahminine dayanan kararlar, iki yönteme göre elde edilen kararların aynı fikirde olup olmadığına bakılmaksızın NHST'ye göre alınanlardan daha iyi kurulur.


10
Cevabınızı her zaman ya da ' her zaman yakında olacak' şeklinde topladım . Bu bir Bayesçi partizörün cevabı.
gung - Reinstate Monica

3
Ve burada Kruschke'nin BEST'in çevrimiçi bir javascript uygulaması. Tarayıcıda Bayesian analizi :) sumsar.net/best_online
Rasmus Bååth

13

θ=P(X<Y)XYXYθ

Xf(x;ξ1)F(x;ξ1)Yg(y;ξ2)G(y;ξ2)

()θ=F(y;ξ1)g(y;ξ2)dy.

(ξ1,ξ2)θ

(ξ1,ξ2)()θ


4
Her iki cevabınıza +1 - bunlar ilginç örneklerdir. Frekansist çözümün, parametrik olmayan yöntemleri görmezden geliyor gibi gözüktüğü halde olasılık temelli olması gerektiğini varsayıyorsunuz. Bu özel durumda, bana bağladığınız kitapta Bölüm 5'in parametrik olmayan frekansçı yöntemleri, en azından Bayesian yöntemleri kadar kullanımı kolay görünmektedir.
MånsT

@ MånsT İyi nokta. Gerçekten de, bu cevap Bayesian'e karşı olabilirlik temelli çıkarımlara odaklanıyor . Bir süre önce, belirttiğiniz gibi Bayesian yaklaşımı kadar kolay olan, parametrik olmayan bir çözüm üzerine bir cevap yazdım .

@ MånsT & Procrastinator, ben de bunu yenmiştim. Bu soru bağlamında “en kolayın” ne anlama geleceği / bunu bana yönelten yıllar boyunca bana yapılan yorumlar net değildir. Çoğunlukla analistin, durumla ilgisi olmayan nedenlerle her zaman daha iyi olacak şekilde teorik bir konuma sahip olduğu cevapları dışlamak istedim . Elbette böyle bir konum savunulabilir ve internette bu tür argümanları görüntülemek için pek çok yer var (bazıları CV de dahil olmak üzere), ancak b / c, insanların davalarını listeledikleri bir yere sahip olmanın ilginç olacağını düşündüm. diğerini kullanacaktı ve neden.
gung - Reinstate Monica

13

Sık sık istatistiklerle (aslında ekonometri konusunda) eğitildim, ancak bakış açımdan bu "epik" savaşın felsefi kaynağının temelden yanlış yönlendirildiğini düşündüğüm için Bayesian yaklaşımına karşı hiçbir zaman karşı karşıya gelmedim. Buradaki görüşlerim ). Aslında yakın zamanda kendimi Bayesian yaklaşımı konusunda da eğitmeyi planlıyorum.

Neden? Çünkü beni en çok matematiksel ve kavramsal bir çaba olarak büyüleyen sıkça istatistiklerin yönlerinden biri, aynı zamanda beni en çok rahatsız ediyor: örneklem büyüklüğü asimptotik. En azından ekonometride, neredeyse hayırGünümüzde ciddi bir makale, genellikle frekans ekonometriklerinde uygulanan çeşitli tahmin edicilerden herhangi birinin, tahmin ediciden isteyeceğimiz istenen "küçük örnek" özelliklerinden herhangi birine sahip olduğunu iddia etmektedir. Hepsi, kullanımlarını haklı çıkarmak için asimptotik özelliklere güvenir. Kullanılan testlerin çoğu sadece asimptotik olarak istenen özelliklere sahiptir ... Ama biz artık "z-land / t-land" içinde değiliz: modern frekansçı kestirim ve çıkarımın tüm karmaşık (ve korkunç) aparatları aynı zamanda son derece kendine özgüdür. bazen, bu değerli asimptotik özelliklerin, çeşitli simülasyonlar tarafından kanıtlandığı gibi tahmin edicilerden türetilen tahminleri olumlu bir şekilde ortaya çıkarması ve etkilemesi için bir laaaaaaaaa ... aaaarge örneğine ihtiyaç duyulmaktadır. On binlerce gözlemin anlamı - bazı ekonomik faaliyet alanları (emek veya finansal piyasalar gibi) için uygun hale gelmelerine rağmen, hiçbir zaman yapamayacakları (en azından benim ömrüm boyunca) başkaları da (makroekonomi gibi) vardır. Ve bundan oldukça rahatsız oluyorum çünkü türetilmiş sonuçları gerçekten ortaya koyuyorbelirsiz (sadece stokastik değil).

Küçük örnekler için Bayes ekonometri yok güvenmek asimptotik sonuçlar üzerinde. "Ama öznel önceliğe güveniyorlar !" basit, pratik, benim cevabım şu: “fenomen daha eskiyse ve çalışıldıysa, önceki veriler geçmişe dayanarak tahmin edilebilir.” Eğer fenomen yeni ise , başka ne olmasaydı? öznel argümanlarla tartışmaya başlayabilir miyiz ?


5
Bu değerli bir bakış açısı, ancak Monte Carlo simülasyonları, önyükleme ve permütasyon testleri gibi asimptotiklere çok fazla güvenmeyen sıkça yaklaşımların olduğunu unutmayın.
gung - Reinstate Monica

1
Ve eğer biri iki dünyadan da en iyisini almaya çalışırsa? Bir girişim: Bartels, Christian (2017): Sık kullanılan testlerde önceki bilgileri kullanmak. figshare. doi.org/10.6084/m9.figshare.4819597.v3 Alınan: 17 18, 10 Mayıs 2017 (GMT)
kullanıcı36160

13

Bu geç bir cevap, yine de bir şeyler ekliyor umarım. Çoğunlukla Bayesian yaklaşımını kullandığımız telekomünikasyon eğitimi aldım.

İşte basit bir örnek: Diyelim ki dört olası +5, +2.5, -2.5 ve -5 volt sinyalini iletebilirsin. Bu setten gelen sinyallerden biri iletilir, ancak sinyal, alıcı uca ulaştığında Gauss gürültüsü tarafından bozulur. Uygulamada, sinyal de zayıfladı, ancak basitliği için bu konuyu bırakacağız. Soru şuydu: Alıcı taraftaysanız, bu sinyallerden hangisinin başlangıçta iletildiğini size söyleyen bir dedektör nasıl tasarlarsınız?

Bu problem açıkça hipotez testi alanında yatmaktadır. Ancak, anlamlılık testi olası dört hipotezi de reddedebileceği için p-değerlerini kullanamazsınız ve bu sinyallerden birinin gerçekte iletildiğini bilirsiniz. Bir dedektör tasarlamak için Neyman-Pearson yöntemini ilke olarak kullanabiliriz, ancak bu yöntem en iyi ikili hipotezler için işe yarar. Birden fazla hipotez için, yanlış alarm olasılıkları için bir takım kısıtlamalar ile uğraşmanız gerektiğinde fazla sakar olur. Bayesian hipotez testi ile basit bir alternatif verilmiştir. Bu sinyallerden herhangi biri iletilmek üzere seçilmiş olabilir, bu nedenle öncekinin denkleştirilebilir olması gerekir. Bu tür donatılabilir durumlarda, yöntem, sinyal olasılığını en yüksek oranda seçerek azalır. Bu yönteme güzel bir geometrik yorum verilebilir: Alınan sinyale en yakın olan sinyali seçin. Bu aynı zamanda karar alanını bir dizi karar bölgesine bölmesine neden olur, eğer alınan sinyal belirli bir bölgeye düşerse, o zaman bu karar bölgesiyle ilgili hipotezin doğru olduğuna karar verilir. Böylece bir dedektörün tasarımı kolaylaşır.


4
Tecrübenizi bizimle paylaştığınız için teşekkür ederiz. Sitemize hoşgeldiniz!
whuber

4

“Frequentist” olarak adlandırılan istatistiksel testler tipik olarak, belirli varsayımlar altındaki prensip olarak daha karmaşık Bayesian yaklaşımına eşdeğerdir. Bu varsayımlar uygulandığında, her iki yaklaşım da aynı sonucu verecektir, bu yüzden Frequentist testini uygulamak daha kolay kullanmak güvenlidir. Genel olarak Bayesian yaklaşımı daha güvenlidir, çünkü varsayımları açık bir hale getirir, fakat ne yaptığınızı biliyorsanız, Frequentist testi genellikle bir Bayesian yaklaşımı kadar iyidir ve genellikle uygulanması kolaydır.


1
Teşekkürler. Frequentist testlerin "genellikle uygulanması daha kolay" olduğunu unutmayın. Durum böyle olmadığında özel bir durum olduğunu biliyor musunuz (F sadece "genellikle" daha kolaysa, bu tür durumlar olması gerekir). Şimdilik, hangi yaklaşımın "daha güvenli" olacağı ile ilgili sorunları bir kenara koyabiliriz ve sadece uygulanması kolay olan bölüme odaklanabiliriz .
gung - Reinstate Monica

4

(En tipik cevap türü olacağını düşündüğüm şeyi deneyeceğim.)

Diyelim ki birkaç değişken ve bir yanıtın olduğu bir durumunuz var ve değişkenlerden birinin yanıtla nasıl ilişkili olması gerektiği hakkında bir şey biliyorsunuz, ancak diğerleri hakkında değil.

Böyle bir durumda, standart bir çoklu regresyon analizi yapacak olsaydınız, önceki bilgiler dikkate alınmazdı. Daha sonra mevcut sonucun diğer bulgularla tutarlı olup olmadığına ışık tutabilmekle ilginç olabilecek ve biraz daha kesin bir tahmine izin verebilecek bir meta-analiz yapılabilir. Fakat bu yaklaşım, bu değişken hakkında bilinenlerin diğer değişkenlerin tahminlerini etkilemesine izin vermez.

Diğer bir seçenek de, söz konusu değişkenle olan ilişkiyi düzelten kendi fonksiyonunuzu kodlamanın ve optimize etmenin mümkün olacağı ve bu kısıtlama ile verilen verinin olasılığını maksimize eden diğer değişkenler için parametre değerlerini bulmasıdır. Buradaki sorun, ilk seçeneğin beta tahminini yeterince kısıtlamamasına rağmen, bu yaklaşım onu ​​aşırı kısıtlıyor.

Durumu daha iyi ele alacak bir algoritma jüri kurabilir, bunun gibi durumlar Bayesian analizleri için ideal adaylar gibi görünebilir. Bayes yaklaşımına dogmatik olarak karşı çıkmayan herkes böyle durumlarda denemeye istekli olmalıdır.


2

Bayesian yöntemlerinin son derece basit, Frequentist yöntemlerin ise son derece zor olduğu bir araştırma alanı Optimal Design ile aynı .

x(1)βx(2)β

βx(i)β^ββ^x(i)β

ββxx

Bayes bakış açısından bakıldığında, bu sorun çok kolaydır.

  1. β
  2. bulunx
  3. x
  4. İstenen doğruluk sağlanana kadar 2 ve 3. adımları tekrarlayın

x


2

Belki de Bayesian yaklaşımının daha kolay olduğu en basit ve yaygın durumlardan biri, parametrelerin belirsizliğini ölçmektir.

Bu cevapta güvenirlik aralıklarının ve güvenilebilir aralıkların yorumlanmasından bahsetmiyorum. Şimdilik, bir kullanıcının iki yöntemden birini kullanarak iyi olduğunu varsayalım.

Bununla birlikte, Bayesian çerçevesinde, doğrudan ileri doğru; Herhangi bir ilgilenilen parametre için posteriorun marjinal varyansıdır. Posterior'dan örnek alabileceğinizi varsayalım, sonra sadece örneklerinizi alın ve varyanslarınızı hesaplayın. Bitti!

Frequentist vakasında, bu, bazı durumlarda genellikle sadece basittir ve olmadığında gerçek bir acıdır. Çok sayıda örneğe karşı (eğer yeterince büyük olduğunu gerçekten bilen) çok sayıda örneğe sahipsek, CI'leri türetmek için MLE teorisini kullanabiliriz. Bununla birlikte, bu kriterler her zaman, özellikle ilginç durumlar için geçerli değildir (yani karışık etki modelleri). Bazen bootstrapping kullanabiliriz, ama bazen yapamayız! Yapamadığımız durumlarda, hata tahminlerini türetmek gerçekten, gerçekten zor olabilir ve sık sık biraz zekâ gerektirebilir (yani, Greenwood'un SE'yi Kaplan Meier eğrileri için türetme formülü). "Bazı akıllılık kullanmak" her zaman güvenilir bir tarif değildir!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.