Bayesian İstatistikleri neden giderek daha popüler bir araştırma konusu haline geliyor? [kapalı]


10

En iyi 100 US News istatistik programının araştırma alanına göz atarken, neredeyse hepsi Bayes istatistiklerinde ağırdır. Ancak, daha düşük kademeli okula gidersem, çoğu hala klasik / sıkça istatistik araştırması yapıyor. Örneğin, şu anki okulum (QS dünya sıralamasında 150'den 200'e kadar derecelendirildi ve bu yüzden en üst seviye bir okul olarak kabul edilmedi) Bayes istatistiklerine odaklanan sadece bir profesöre sahip ve Bayes istatistiklerine neredeyse bir kızgınlık var. Hatta konuştuğum bazı lisansüstü öğrencileri, Bayesci İstatistikçilerin, kesinlikle kabul etmediğim uğruna Bayes istatistikleri yaptığını söylüyor.

Ancak, neden böyle olduğunu merak ediyorum. Birkaç eğitimli tahminim var:

(a) Klasik / sık istatistiklerin metodolojisindeki ilerlemeler için yeterli yer yoktur ve klasik / sık istatistik istatistik araştırmalarındaki tek geçerli araştırma, üst kademe okulun daha fazla olması gerektiğinden alt kademenin ana odağı olacak uygulamalar üzerinedir. teorik ve metodolojik araştırmaya yönelmiştir.

(b) Ağır alana bağımlıdır. Bazı istatistik dalları, istatistik yönteminin birçok bilimsel uygulaması gibi Bayes istatistikleri için daha uygundur, diğer şube ise finansal alan gibi klasik istatistikler için daha uygundur. (eğer yanılıyorsam düzelt) Bana göre, üst kademe okulların bilimsel alanda uygulama yapan birçok istatistik fakültesi var gibi gözüküyor, daha düşük kademe okul istatistikleri bölümü ise gelir elde etmelerine yardımcı olduğu için ağırlıklı olarak finansal alanda uygulamalara odaklanıyor ve finansman.

(c) Örneğin MLE'nin aşırı takılmasına eğilimli, vb. çözülemeyen sıkça kullanılan yöntemde büyük sorunlar var.

(d) Hesaplama gücü buradadır, bu nedenle Bayes hesaplaması 30 yıl önce olduğu gibi artık bir darboğaz değildir.

(e) Bu benim en tahmin edilen tahminim olabilir. Klasik / frekansçı İstatistikçi'den, klasik istatistiklerin rolünü potansiyel olarak üstlenebilecek yeni bir metodoloji dalgasından hoşlanmayan bir direnç var. Ancak Larry Wasserman'ın dediği gibi, bu ne yapmaya çalıştığımıza bağlıdır ve herkes özellikle açık bir araştırmacı olarak açık fikirli olmalıdır.


1
Özgeçmişlerin görüşleri değişecek ve bu görüş konu dışı olarak değerlendirilse de, tam olarak bu sorunun Bayes analizi hakkındaki modern metinlerin giriş bölümlerinde cevaplandığına dikkat çekmek gerekir. Özellikle, Gelman ve diğ. Bölüm 1 Bayesian Veri Analizi 3. Baskı. A) "sağduyu" ve b)% 99'umuzun yardım edemediği, yanlış yorumlayamadığı son derece sorunlu, frekansçı güven aralığına dayanır. Yolu biz de olsun-go dan Bayes analizi yapabilir böylece biz onu çarpıtmaya özünde Bayes olduğunu.
Peter Leopold

3
@Peter Leopold Yarı ciddi mi:% 99? ve "biz" kimdir? Pek çok saf istatistik kullanıcısı gerçekten de CI'ler hakkında ciddi yanılgılara sahiptir, ancak CV topluluğuna hitap ediyorsanız,% 99'un gerçekten uymadığını umarım. İstatistiksel insanlar, sabit verilerin yokluğunda rakamlar oluşturmada herkes kadar kötü olabilir!
Nick Cox

@ NickCox I, OP'ye hitap ediyordu ve "biz" in empatik ve kapsayıcı olması gerekiyordu. Umarım, "% 99" bir büyüklük tahmini sırası olarak kabul edilir~10-2. Aynı zamanda, popüler kültürde sahip ol / olmamanın daha büyük bir kısmıdır, bu bağlamda yokluklar olayı gösterir: "İstatistikleri 101 aldım, ama sık aralıklarla Bayes güven aralığını yorumlamamıştım. güvenilir aralıklar. " Ve şimdi beni aradığına göre, o olaydan önce bunun benim resmi görevim olduğunu iddia edeceğim (: D)! Doğal olarak, başka türlü ikna olmaya hazırım! : D
Peter Leopold

Yanıtlar:


8

Şahsen, birkaç tahminde bulunacağım:

(1) Bayes istatistikleri son birkaç on yılda popülerlikte büyük bir artış gördü. Bunun bir kısmı MCMC'deki gelişmeler ve hesaplama kaynaklarındaki gelişmelerden kaynaklanıyordu. Bayesci istatistik teorik olarak gerçekten güzel olmaktan, ancak sadece oyuncak problemleri için geçerli olmaktan daha evrensel olarak uygulanabilecek bir yaklaşıma geçmiştir. Bu, birkaç yıl önce, Bayesci istatistiklerde çalıştığınızı söyleyerek muhtemelen sizi çok rekabetçi bir işe alma haline getirdiği anlamına gelir.

Şimdi, Bayesian istatistiklerinin hala bir artı olduğunu söyleyebilirim, ancak Bayesian yöntemlerini kullanmadan ilginç sorunlar üzerinde çalışıyor. Bir eksiklik Bayes istatistikte arka planın kesinlikle en işe komitelere eksi olacaktır ama Bayes yöntemlerinde yeterli eğitim olmadan istatistik doktorası almak oldukça şaşırtıcı olurdu.

(2) Bayesli istatistikçiler özgeçmişlerinde "Bayesci" den söz edecekler. Frekans uzmanları genellikle özgeçmişlerine "Frekansçı" koymazlar, fakat daha tipik olarak çalıştıkları alanı (yani hayatta kalma analizi, öngörücü modelleme, tahmin vb.). Örnek olarak, yaptığım işlerin çoğu, optimizasyon algoritmaları yazmak. Sanırım, Frequentist iş yaptığım anlamına gelir. Ayrıca Bayesian algoritmalarının oldukça büyük bir kısmını da yazdım, ama kesinlikle işimin azınlığında. Bayes istatistikleri CV'mde, Frequentist istatistikler değil.

(3) Bir ölçüde, sorunuzda söyledikleriniz de doğrudur. Verimli genel Bayes hesaplamasında Frequentist alemden daha açık problemler vardır. Örneğin, Hamiltonian Monte Carlo son zamanlarda Bayes modellerinden jenerik olarak örnekleme için çok heyecan verici bir algoritma haline geldi. Jenerik iyileştirme için çok yer yokgünümüzde optimizasyon; Newton Raphson, L-BFGS ve EM algoritmaları birçok tabanı kapsar. Bu yöntemleri geliştirmek istiyorsanız, genellikle soruna çok fazla uzmanlaşmanız gerekir. Bu nedenle, "Yüksek boyutlu Maksimum Olabilirlik Tahmini üzerinde çalışıyorum" yerine "Coğrafi mekansal modellerin yüksek boyutlu optimizasyonu üzerinde çalışıyorum" demeye daha çok benziyorsunuz. Makine öğrenimi dünyası bunun bir istisnasıdır, çünkü yeni stokastik optimizasyon yöntemlerini (yani SGD, Adam, vb.) Bulmakta çok fazla heyecan vardır, ancak bu birkaç nedenden dolayı biraz farklı bir canavardır.

Benzer şekilde, modeller için iyi öncelikler bulmak için yapılması gereken işler var. Frequentist yöntemler yapmak Buna eşdeğer bir (iyi cezalar geliyor yani LASSO, glmnet) var ama cezalar üzerinde priors muhtemelen daha verimli bir zemin var.

(4) Son olarak, bu kesinlikle daha kişisel bir görüştür, birçok insan Frequentist'i p-değerleriyle ilişkilendirir. Diğer alanlarda gözlenen p-değerlerinin genel kötüye kullanımı göz önüne alındığında, birçok istatistikçi, p-değerlerinin mevcut yanlış kullanımlarından mümkün olduğunca uzak durmak ister.


3
Bu yüzden neden daha popüler hale geldiğinin cevabı (1) daha popüler hale geliyor. Buna şaşkın, ama bunun sadece yeniden sarılmaya ihtiyaç duyduğunu düşünüyorum.
Nick Cox

@NickCox: benim açımdan tam o olduğunu daha popüler, ama aynı zamanda onun popülerlik biraz abartılmış olabilir. Yani, OP, Bayes İstatistiklerinin en üst düzey üniversitelerdeki bir örnekte hemen hemen her profesörün CV'sinde olduğunu gördü. Ancak bu, profesörlerin her birinin sadece Bayesci istatistik yaptığı anlamına gelmez. (1) üzerine bir başka nokta orada düşünüyorum olmasıydı oldu araştırma alanı üst katman konumunu almak için çok önemliydi olarak Bayes istatistik yaparken bir zaman. Artık bir gereklilik kadar katı olduğundan emin değilim, ancak şu anda gördüğünüz profesörlerin çoğu o dönemde işe alındı.
Cliff AB

Demek istediğini anlıyorum. "Klasik / frekansçı istatistiklerde ilerlemeye yeterli yer olmadığı için mi?" Tartışmasına odaklanıyordum. ve "bu neden oluyor?"
Cliff AB
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.