Bayesian analizinin eksileri nelerdir?


44

Bayesian istatistik yöntemlerinin herhangi bir bağlamda kullanılmasına yönelik bazı pratik itirazlar nelerdir? Hayır, her zamanki seçim seçimini umursamıyorum demek istemiyorum. Bu cevap alamazsa çok sevinirim.


5
Soru tamam çerçeveli, ancak yorumlar tartışma dizisine doğru yaklaşıyor ve satırın yanlış tarafına dökülmekle tehdit ediyor. Dikkatli olun ... burası böyle bir tartışmanın yeri değil. Bunu yapmak istiyorsanız bir sohbet odası oluşturun.
whuber

Yanıtlar:


40

Sana bir cevap vereceğim. Aslında dört dezavantaj. Bunların hiçbirinin gerçekte sıklık analizine kadar yol göstermesi gereken itirazların olmadığını, ancak bir Bayesian çerçevesine gitmenin eksileri olduğunu unutmayın:

  1. Önceden seçim. Bu, bir nedenden ötürü olağan bir ihmaldir, ancak benim durumumda normal "öncelikler öznel" değildir. ama bu bir önceki ile geliyor aslında iyi gerekçeli olduğunu ve temsil eden bir önceki özetleme adresinden iyi girişimi birçok durumda çalışmaları büyük bir anlaşma. Örneğin, tezimin bütün bir amacı, "tahmini tahminler" olarak özetlenebilir.
  2. Hesaplamalı olarak yoğun. Özellikle birçok değişken içeren modeller için. Pek çok değişkenin tahmin edildiği büyük bir veri kümesi için, özellikle verilerin bir kümeye veya benzeri bir öğeye kolayca atılamayacağı belirli durumlarda, aşırı derecede hesaplama açısından yoğun olabilir. Bunu çözmenin yollarından bazıları, MCMC yerine artırılmış veriler gibi, en azından benim için teorik olarak biraz zorlayıcı.
  3. Posterior dağılımlar, dağılımın sık, parametrik bir tanımlaması yapılmadığı sürece, bir meta-analize dahil edilmesi biraz daha zordur.
  4. Analizin hangi dergiye yönelik olması gerektiğine bağlı olarak, genel olarak Bayes kullanımı veya öncelikli tercihleriniz, bir gözden geçirenin içine girebileceği yerlere biraz daha fazla puan verir. Bunlardan bazıları makul eleştirmenlerin itirazlarıdır, ancak bazıları Bayes'in doğasından ve bazı alanlardaki insanların tanıdıklarından kaynaklanmaktadır.

Bunların hiçbiri seni durdurmamalı. Gerçekten, bunların hiçbiri beni durdurmadı ve umarım Bayesian analizini yapmak en az 4 numaraya yardım edecektir.


2
# 1, bu, ideal olarak, ilk aşama analizi olmalıdır. Sanatta aydınlatılmış bir inceleme. Bilimde nicel bir inceleme. Bayesanlar bunun için özür dilememelidir. Frekanslar verilere Adem ve Havva gibi yaklaşıyorlar - sorun değil. Doktora çalışmamın ilk bölümü meta-analiz (sıkça da olsa) .Whoopdeedoo. Olması gereken bu. # 2 Moore yasası, yerel bir Yüksek Performanslı Bilgi İşlem grubu ile kısa bir XKCD tabanlı tartışma buldum ve çok yardımcı olabilir. # 3 Meta Analiz, her iki şekilde de berbat. Başka bir deyişle, zorunlu yuvarlanma mega analizinden yanayım - yayınladığınızda verilerinizi sağlayın.
rosser

7
@rosser Birkaç düşünce. # 1. Gerçekten de aydınlatılmış bir inceleme olmalı ve evet, bu birinci adım olmalı. Ancak, şaşırtmayı kontrol eden uygun bir Bayesian analizi , modele dahil edilecek her değişkenin tam, nicel aydınlatmalı bir incelemesini gerektirir . Bu küçük bir iş değil. # 2. Moore yasasına bağlı olarak kötü bir fikirdir. İlk olarak, son kazanımlar çoğunlukla çok çekirdekli / GPU sistemlerinde yapılmıştır. Bunun için yazılmış bir yazılıma ve paralel işlemden kaynaklanan sorunlara ihtiyacı var. MCMC ile yapılan tek bir GLM modeli bu olmayabilir. Devam ...
Fomite

6
@ roger ve HPC ile zaman olabilir mutlaka cevap değildir. Örneğin, veri kullanım sözleşmelerinin ve benzerlerinin sıklıkla güvenli sistemlerin yanı sıra nesnelerde verilerin depolanmasını önlediği alanlarda çalışıyorum. Yerel küme ... öyle değil. Ve sonunda, Moore Yasası sadece donanım bütçeniz büyük olduğu kadar iyidir. 3. ve meta-analiz konusunda, aynı fikirde değilim, ancak bunun ötesinde, tamamen açık veri sisteminin norm haline geldiği noktaya kadar bir problem olmaya devam ediyor.
Fomite

Tamam # 3 fazla abarttım. Ama HER PREDICTOR konusundaki önceliğiniz sonuçta ne kadar fark eder? srsly? Duyarlılık analizi muazzam farklılıklar gösteriyor mu?
rosser

1
@Rosser Muhtemelen tahmininizin doğasına ve bunun maruziyet ve sonuçla olan ilişkisine bağlıdır. Fakat duyarlılık analizi yapmak için birisinin tüm bu değişkenler için bir önceliği olması gerekir. Belki de tezimin bir bölümü olarak ekleyeceğim. Ayrıca Bayes’in gücünü koordine ederken buluyorum, ancak biraz problemli olan "bulmak için rahatsız edilemeyeceğim" değişkenleri hakkında bilgilendirici olmayan öncelikleri kabul ediyorum.
Fomite

16

Ben bir eğim tarafından Bayes, ama pratikte genellikle bir sıkıcıyım. Bunun nedeni genellikle ilgilendiğim sorun türleri için tam Bayesian analizinin tam olarak yapılması (örneğin MAP çözümleri yerine) zor ve hesaplama açısından yoğundur. Sıklıkla tam bir Bayesian analizi bu yaklaşımın sıkça eşdeğerler üzerindeki faydasını görmek için gereklidir.

Benim için takas, temel olarak kavramsal olarak zarif ve anlaşılması kolay olan ancak pratikte zor olan ve sık sık garip ve pratik olan sıkça kullanılan yöntemlerle Bayesian yöntemleri arasında bir seçimdir. neden gerçek değerin% 95 güven aralığında olması ihtimalinin% 95 olma ihtimali yoktur), ancak bunlar kolay uygulanabilen "yemek kitabı" çözümlerine çok uygundur.

Kurslar için atlar.


11

Tamamen pratik bir bakış açısına göre, çok fazla hesaplama gerektiren bir yöntem hayranı değilim (genellikle Bayesian çerçevesinde kullanılan Gibbs örnekleyici ve MCMC'yi düşünüyorum, ancak bu örneğin frekans analizindeki önyükleme teknikleri için de geçerlidir ). Bunun nedeni, her türlü hata ayıklamanın (uygulamayı test etme, varsayımlara göre sağlamlığa bakma vb. ) Kendisinin bir sürü Monte Carlo simülasyonu gerektirmesidir ve hızlı bir şekilde hesaplamalı bir ahlaksızlığınız vardır. Altta yatan analiz tekniklerinin sadece yaklaşık olsalar bile hızlı ve deterministik olmasını tercih ederim.

Elbette bu tamamen pratik bir itiraz: Sonsuz bilgi işlem kaynaklarına bakıldığında, bu itiraz kaybolacaktı. Ve bu sadece Bayes yöntemlerinin bir alt kümesi için geçerlidir. Ayrıca bu benim iş akışım için daha çok tercih edilen bir şey.


1
Şimdiye kadar duyuyorum 1. Moore'e Yasası, 2. Zor iş +/- sabır ve 3. Cehalet. Bunların hiçbirinin ikna edici olmadığını söylemek zorundayım. Bayes, aşırı kemerli bir paradigmaya benziyor. Örneğin ... neden GWAS çalışmaları bir la Bayes analiz edilmedi. Verilerin% 99,999'unu atmayı önleyebilir miydi?
rosser

1
Tersine: MCMC, birine daha hızlı kod yazmayı ve simülasyonların tamamlanmasını beklemenin acısından bir şeyler öğrenmeyi öğretebilir. Bu benim modelleme konusundaki deneyimim oldu: çalışması uzun zaman alıyorsa, kodun nasıl daha hızlı yapılacağını öğrenmekten faydalanabilirim.
Yineleyici

9

Bazen bir soruna basit ve doğal bir "klasik" çözüm olabilir, bu durumda süslü bir Bayesian yöntemi (özellikle MCMC'de) fazlaca olabilir.

Ayrıca, değişken seçim tipi problemlerinde, cezalandırılmış bir ihtimal gibi bir şeyi düşünmek daha kolay ve anlaşılır olabilir; Eşdeğer bir Bayesian yaklaşımı veren modellerde bir öncelik olabilir, ancak öncenin nihai performansa nasıl karşılık vereceği, ceza ve performans arasındaki ilişkiden daha az net olabilir.

Son olarak, MCMC yöntemleri genellikle hem yakınsama / karışımı değerlendirmek hem de sonuçları anlamak için bir uzman gerektirir.


9

Bayesian yöntemlerine nispeten yeniyim, ama beni rahatsız eden bir şey, önceliklerin gerekçesini anladığım halde (yani, bilim kümülatif bir çabadır. Verilerin yorumlanması), Bayesci yaklaşımın sizi öznelliği analizin başlangıcına itmeye zorlamasını sevmiyorum, sonuçta koşullu hale getirdim. Bunun iki nedenden dolayı sorunlu olduğuna inanıyorum: 1) biraz daha iyi tanınan okuyucular, önceliklere bile dikkat etmeyecek ve Bayesian sonuçlarını koşulsuz olarak yorumlamayacak; 2) Ham veriler mevcut olmadıkça, okuyucuların sonuçları kendi öznel öncelikleri içinde yeniden yorumlamaları zordur. Bu yüzden ihtimal oranlarını tercih ediyorum.

(Astute eleştirmenleri, olasılık oranlarının bile karşılaştırılan modellerin parametreleştirilmesinde koşullu olduğu anlamında "koşullu" olduğunu not edecektir; ancak bu, tüm yöntemler, Frequentist, Bayesian ve Likelesshoodist tarafından paylaşılan bir özelliktir)


9
Frekansçı istatistiklerle ilgili konuşma sorunu, öznelliğin orada olmasıdır, ancak hiç belirtilmemiştir. Olasılık oranlarıyla (pratik) sorun, olasılığın optimizasyonuna dayanmalarıdır ve bu nedenle olasılıkla sadece daha az olasılıkla başka çözümler olabileceği gerçeğini görmezden gelirler. Bayes faktörünün faydalı olduğu yer burasıdır. Ama her zaman "kurslar için atlar" dır.
Dikran Marsupial

6

Karar teorisi, istatistiklerin üzerinde çalıştığı temel teoridir. Sorun, verilerden kararlar üretmek için iyi (bir anlamda) prosedür bulmaktır. Bununla birlikte, beklenen zararı en aza indirgeme anlamında nadiren belirsiz bir prosedür seçimi vardır, bu yüzden aralarından seçim yapmaları için başka kriterler çağrılmalıdır. Bir önceye göre Bayes olan prosedürleri seçmek bu kriterlerden biridir, ancak her zaman istediğiniz şey olmayabilir. Minimax bazı durumlarda veya tarafsızlıkta daha önemli olabilir.

Frekansistlerin yanlış ya da Bayesanlar ya da yanlışlar konusunda ısrar eden kişiler çoğunlukla istatistiklerini görmezden gelirler.


5

Bir süredir kendimden daha fazla bilgi edinmek için Bayesci yaklaşımlar konusunda modellik anlayışımı aşmak için modellik yapmak istedim (Gibbs örnekleyicilerini lisansüstü ders çalışmasında kodladım, ancak hiçbir zaman gerçek bir şey yapmadım). Yol boyunca Brian Dennis'in bazı evraklarının kışkırtıcı olduğunu düşünmüştüm ve bir Bayes arkadaşı buldum (dolabında olmayanlar) gazeteleri okumak ve tezgâhlarını duymak isterdim. Yani, burada atıfta bulunduğum yazılar var, ama her zaman hatırladığım alıntı

Bayesian olmak, asla yanıldığını söylemek zorunda kalmamak anlamına gelir.

http://faculty.washington.edu/skalski/classes/QERM597/papers/Dennis_1996.pdf http://classes.warnercnr.colostate.edu/nr575/files/2011/01/Lele-and-Dennis-2009.pdf


1
İlk makale (ikinciyi okumamış), bayilerin teoriye karşı nasıl uygulandıkları hakkında daha fazla görünüyor. Uygulamada modeller gerektiği kadar titizlikle kontrol edilmemektedir, ancak teoride bayesyen istatistiklerinde, Baynes kuralının paydası P (D | modelinde) bulunan Jaynes'in "kanıtı" olarak adlandırılan üstün model kontrol olanakları vardır. Bununla beraber, modellerin uygunluğunu karşılaştırabilirsiniz, yalnızca ampirik olarak istatistiklerde yapabileceğiniz bir şey. Sorun, tabii ki, bu yüzden çoğu insan bunu görmezden ve posterior tüm önemli faktör (devamı) olduğunu düşünüyorum, delil hesaplamak zor olmasıdır
cespinoza

2
nk. 2 "İç içe geçmiş beceriyi deneyimleme" (Googling) örneklemesini deneyin; kanıtları hesaplamak için bir MCMC yöntemi hakkında bir makale bulacaksınız. (Kanıta dayalı olmayan diğer model kontrol yöntemleri de var: Gelman, modellerini arka tahminden örnek alarak ve bunu (görsel olarak veya başka bir şekilde) gerçek verilerle karşılaştırarak kontrol eder.) Bazı insanlar bile modellerin görüntülenmesiyle ortalaması alınmasını önermektedir. modelin kendisinin marjinalleşmesi. Ufukta görebileceğimiz bir diğer şey, geleneksel parametrik modellerden çok daha geniş bir model yelpazesine izin vererek sorunu çözen parametrik olmayan baylar.
cespinoza

5
Ayrıca, Michael I. tarafından yayınlanan videolectures.net/mlss09uk_jordan_bfway'i izlemenizi öneririm . Ürdün, berkeley'de profesör Bayes ve Freq hakkındaki düşüncelerinde oldukça dengeli bir profesör. "savaş". İlk makalenin ikinci yarısında gerçekten yorum yapamam b / c Ekolojik referansların hiçbirini tanımıyorum. İkincisini sonra okuyacağım.
cespinoza

1
@cespinoza: İşe giderken bunu düşünüyordum. Belge, bir Bayescanın artıklara asla bakmayacağını (yani model çıktısını gerçek verilere göre karşılaştırmak) ve belki de güçlü bir Bayesçinin bu prensipten kaçabileceğini söylüyor, ancak Gelman gibi uygulayıcılar kesinlikle model çıktısını (tahmine dayalı posterior) gerçek verilerle karşılaştırıyorlar. Daha ileri gitmek için yeterince bilgim yok, ancak kağıtlara ilişkin izlenimim, saman prensiplerini saldıracak "prensip" olarak ayarladıkları.
Wayne

1
Kalıntıları kontrol etmeyen bir Bayesian’ün kötü bir istatistikçi olduğunu eklemeniz yeterli. Genellikle, bir Bayesian yöntemi "kaba ve hazır" bir modelle kullanılır ve önceden kullanılır. Kalıntıları kontrol etmek, önceki ve modele ilişkin bilginizi yeterince alıp almadığınızı görmenin bir yoludur. Modelinizin ve öncekinin hangi teorik özelliklere sahip olduğunu kontrol etmek için el ele gidiyor
olasılık

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.