Bir bayesian gibi düşünün, sık görüşme yapın: Bu ne anlama geliyor?


35

Burada bulunabilecek bir veri bilimi dersinde bazı ders slaytlarına bakıyorum:

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

Maalesef bu ders için videoyu göremiyorum ve slaytın bir noktasında sunum yapan kişi şu metni içeriyor:

Bazı Anahtar İlkeler

Bir Bayesian gibi düşünün, bir Frequentist (uzlaşma) gibi kontrol edin

Bunun ne anlama geldiğini bilen var mı? Bundan toplanacak bu iki düşünce okulu hakkında iyi bir içgörü olduğunu hissediyorum.


2
Model kontrolü ile ilgili olabileceğini düşünün: Bkz. Bir Bayescanın artıklara bakmasına neden izin verilmiyor? .
Scortchi

@Scortchi Topladığımdan, bunun eğitim, onaylama ve test veri kümelerinin bir şekilde ayrılması ile ilgisi yok mu, belki de Bayesyan'ın modelin eğitim aşamasında bile öncelikleri değiştirmesine izin verilmez (bir ML terimi kullanmak) İşte). Yine de, sık sık olduğu gibi kontrol etmenin ne anlama geldiği konusunda kafam karıştı ...
Luca

1
"Uygun" bir Bayesian asla önceliklerini ayarlamaz, ancak Bayes Teoremi'ni kullanarak onları yalnızca yeni bilgilere göre günceller. Ama ben sadece bu "temel prensip" in ne hakkında olabileceğini tahmin ediyorum.
Scortchi

4
Bağlantıyı yükleyemedim. Tahminime göre, Bayesian yöntemlerini kullanıyor olsanız bile, Sıklıklı çalışma özelliklerini önemsemelisiniz: Son derece sıkı olan% 95 güvenilir aralıklar oluşturuyorsanız, ancak pratikte, zamanın% 20'sini ilgilendiren gerçek parametreyi kapsar. endişelenmeli misin Aşırı sert bir Bayesyen "hayır" diyebilir (ancak bu tür sertlikte çok az sayıda Bayesi'li var).
Cliff AB

3
Gelecekteki slaytları dört gözle bekliyorlar, Ampirical Bayes'i onaylıyorlar. Bu, aşağıdaki slayt setinde
Cliff AB

Yanıtlar:


32

Bayesian ile sık kullanılan istatistik okulları arasındaki temel fark, olasılık yorumlamasındaki farklılıktan kaynaklanmaktadır. Bayes olasılığı, bir olayın olacağına (veya gerçekleşeceğine) ilişkin kişisel inanç hakkında bir ifadedir. Sık sık bir olasılık, bu olayların sayısı arttıkça limitte meydana gelen benzer olayların oranı hakkında bir ifadedir.

Benim için, "bir Bayesian gibi düşünmek", yeni bilgiler ortaya çıktıkça kişisel inancınızı güncellemek ve bu işlemlerin kullanıldığı zamanlar boyunca toplanmış istatistiksel prosedürlerin performansıyla ilgilenmek anlamına gelip "bir sıklıkçı gibi endişelenmek" anlamına gelir. Örneğin, güvenilir aralıkların kapsamı nedir, Tip I / II hata oranları nedir?


1
Cevabınız için teşekkür ederim. Benim gibi meslekten olmayan insanlar için bile özlü ve etkili!
Luca,

2
Öncekiların etkisini araştırarak veya bilgi vermeyen bir kişi kullanarak Bayesian gibi kontrol etmek ya da endişelenmek mümkün değil mi? Bu sadece sıralı analizlere uygulanabilir mi? Bayesian ve Frequentist istatistiklerinin sıralı analizlerle kesiştiği, “inanç güncellemenin” gerekli olmadığı ve sıralayıcı istatistiklerin sıklık ortamında titizlik kazanabileceği konusunda birçok çalışma yapıldı.
AdamO

1
Evet, bir Bayesian gibi endişelenmek mümkündür, örneğin öncekilerinizin etkisini araştırmak. Hayır, cevabım sadece sıralı analizler için geçerli değil, yani yeni bilgiler aynı anda ortaya çıkabilir.
jaradniemi

15

Bayesci istatistik inançları özetlerken, sıkça istatistiklenenler kanıtları özetlemektedir. Bayesliler olasılığı bir inanç derecesi olarak görüyorlar. Bu kapsayıcı ve üretken mantık türü, hipotezleri formüle etmek için yararlıdır. Örneğin, Bayesanlar, astronotların bunu doğrulamak için gerçekten oraya seyahat edip etmediklerine bakılmaksızın, ayın yeşil peynirden yapılmış olduğu fikrine keyfi bir şekilde bazı olasılıklar atayabilirler. Bu hipotez belki de, uzaktan bakıldığında ayın göründüğü fikri ile desteklenir.yeşil peynir gibi. Sıklıkçılar tekil olarak bir pipetçiden daha fazlası olan bir hipotezi düşünemez, ne de kanıtlar bir hipotezi diğerine göre destekleyemezler. Maksimum ihtimal bile, yalnızca “gözlemlenenlerle en tutarlı olan” bir istatistik oluşturur. Resmen, Bayesian istatistikleri kutunun dışında düşünmemize ve verilerden savunulabilir fikirler önermemize izin verir. Ancak bu kesinlikle doğada ortaya çıkan hipotezdir.

Sık sık istatistikler en iyi varsayımları doğrulamak için uygulanır. Bir deney iyi yapıldığında, sıkça istatistik, öncelikleri esneterek bulgular için "bağımsız bir gözlemci" veya "ampirik" bir bağlam sağlar. Bu Karl Popper bilim felsefesi ile tutarlıdır. Kanıtın amacı, belli bir fikri yaymak değildir. Bol miktarda kanıt, yanlış hipotezlerle tutarlıdır . Kanıtlar sadece inançları tahrif edebilir.

Öncelikleri etkisi genellikle istatistiksel muhakemede önyargı olarak kabul edilir. Bildiğiniz gibi, olayların gerçekleşmesi için çok sayıda sebep oluşturabiliriz. Psikolojik olarak, birçok insan gözlemcimizin önyargısının beynimizde gördüklerimizi gerçekten ağırlıklandırmaktan alıkoyan önceliklerin sonucu olduğuna inanıyor. Rahip Annesi, Dune’da dediği gibi “Bulutları gözlemleyin ümidi”. Popper bu fikri titizleştirdi.

Bu, zamanımızın en büyük bilimsel deneylerinden bazılarında büyük tarihsel öneme sahipti. Örneğin, John Snow titizlikle Kolera salgını için delil toplanır ve Kolera olduğu zekice sonucuna değil ahlaki yoksunluk nedeniyle ve delil kanalizasyon kirlenme ile son derece tutarlı olduğuna işaret etti: notu o vermedi sonuçlandırmakBu, Snow'un bulguları bakterilerin keşfedilmesine öncülük etti ve mekanik veya etyolojik bir anlayış yoktu. Benzer bir söylem Türlerin Kökeni'nde de bulunur. Astronotlar yüzeye inip örnekleri toplayana kadar ayın yeşil peynirden yapılmış olup olmadığını bilmiyorduk. Bu noktada, Bayesian posteriorları başka herhangi bir olasılığa çok ama çok düşük olasılıklar atadılar ve en iyi durumda Frequentists örneklerin ay tozu dışındaki herhangi bir şeyle oldukça tutarsız olduğunu söyleyebilir.

Özet olarak, Bayesian istatistikleri hipotez üreten için elverişli ve sıkça istatistik ise hipotez onayına uygun. Verilerin bu çalışmalarda bağımsız olarak toplanmasını sağlamak, modern istatistikçilerin karşılaştığı en büyük zorluklardan biridir.


1
Cevap için teşekkürler. Derken ne demek istedin Plenty of evidence is consistent with incorrect hypotheses?
Luca

2
@Luca Şaşırtmada ortak bir istatistiksel örnek bulunabilir. Örneğin, "Sigara içmek ergenlere daha iyi akciğer işlevi verir" diyebilirim. Daha fazla fiziksel aktivite, sağlıklı iştah ve sağlıklı sosyalleşmeyi teşvik eden sigaranın bir uyarıcı olduğunu söyleyerek rasyonelleştirmek için daha ileri gidebilirim. Verileri toplarsam, gerçekten sigara içen ergenlerin daha iyi akciğer fonksiyonlarına sahip olduğunu gösterirler . İlişkisel sonuç doğrudur, ancak nedensel olan yanlıştır. Daha büyük çocukların sigara içmesi daha muhtemel olduğundan, ilişki yaşa göre karışıktır.
AdamO

Teşekkür ederim! Bu çok iyi yazılmış cevaptan çok şey öğrendim.
Luca

5

OP'ye Cliff AByaptığı açıklamada, bir Empirical Bayesian felsefesine doğru gidiyor gibi görünüyor. Üç ana Bayesian düşünce okulu vardır ve Ampirical Bayes , sık sık sık kullanılan yöntemlerle verilerden önceki değerleri tahmin eder. Bu, tam olarak alıntıya uymuyor (daha sonra Bayes'i öne sürüyor, sık sık benzer kaygılarla geliyor), ancak Cliff ABmükemmel yorumu göz ardı etmemeliyiz .

Ayrıca, bir Bayesian okulu, bir Bayesian prosedüründen sonra hiçbir şeyi kontrol etmeniz gerekmediğini düşünüyordu. Daha modern düşünce, posterior öngörücü kontrolleri kullanırdı ve belki de bu tür cevaplarınızı iki kez kontrol edin yaklaşımı, teklifin ifade ettiği şeydir.

Ayrıca, sık felsefe, verilerden çıkarımlar yerine prosedürlerle ilgilidir. Belki de bu, teklifin anlamının bir ipucudur.


İlk yorumuma atıfta bulunduğunu ve ikinci yorumumun daha yakın bir incelemeden sonra özellikle Empirical Bayes'e atıfta bulundukları konusunda haklı olduğunuzu düşünüyorum. Her iki düşünce okulunun avantajlarını değerlendirmek için yapılan genel bir çağrıdan ziyade, bu teklifin yalnızca Ampirik Bayes'in bir onaylaması olduğu gerçeğini hayal kırıklığına uğrattım. Oh iyi.
Cliff AB

2

Bu veri bilimi dersi bağlamında, "sıkça yapılanlar gibi kontrol et" yorumum, tahmin fonksiyonunuzun veya karar fonksiyonunun, yapılan onaylama verisi üzerindeki performansını değerlendirmenizdir. "Bir Bayesian gibi düşün" önerisi, bir Bayesian yaklaşımından elde edilen bir tahmin fonksiyonunun genellikle iyi sonuçlar vereceği görüşünü ifade eder.


(Şeytanın savunucusu oynamak :) Neden Bayesian yaklaşımı "iyi sonuçlar" vermeli ve sık sık olmasın?
Tim

Bayesian yöntemleri yaklaşım hakkında kurallıdır. Sıklık istatistikleri, karar teorisinin bir parçası olarak görülebilir ve herhangi bir karar fonksiyonunu değerlendirmek için bir çerçeve sunar (Bayesian veya bazı sık ilkeler temelinde). Maksimum olabilirlik yöntemleri gibi belirli yöntemler sıklıkla sıkça bağlamda kullanılır, çünkü iyi sıklıkçı özelliklere sahiptirler (örneğin asimptotik olarak doğru olanı yaparlar ve diğer çoğu yöntemden daha hızlı bir şekilde elde ederler). Bir Bayesian yöntemi kesinlikle bir frekans uzmanı tarafından kullanılabilir, ancak bunu kullanmak için farklı sebepleri olabilir.
DavidR

Bayesian yöntemleri de karar teorisi ile ortak çok var. Ben de do not Bayes yöntemleri frequentist bağlamda kullanılabileceğini düşünüyorum - bu yerine başka bir yöntemdir (frequentist bağlamda sabıkası kullanarak hayal ediyorum nasıl?): Birçok frequentist yöntemleri Bayes farklı yorumlanır. Bunu tartışmanın bir anlamı olduğunu sanmıyorum, söylediklerimin bazı şeyleri biraz fazla basitleştirdiğini söylüyorum.
Tim

Kişi Bayesian yaklaşımları hakkında pek çok hoş sıklık özelliği olduğunu kanıtlayabilir, bu nedenle, Bayesian'da bir şeyler yapmak, yeterince bilginiz olduğu sürece oldukça güvenlidir.
DavidR

1
Diyelim ki bir jeton çevirideki kafaların p sayısını tahmin etmek istiyorum. Bir Bayesyen olarak, p olasılığına bir öncekiyle başlardım, bazı verileri gözlemlerdim ve sonra p'ye bir posterior alırdım. P noktası tahmini yapmalıyız ve posterior dağılımımın ortalamasını nokta tahminim olarak kullanmayı tercih ediyorum. Tüm söylenenler, bu verilerden nokta tahminine geçmek için bir yöntemi açıklar. Bu yöntem sıkça değerlendirilebilir: örneğin önyargılı mı? tutarlı? asimptotik olarak verimli mi? Bir öncekinin dahil olduğu gerçeği, kendiliğinden, sıklığı ilgilendirmemelidir.
DavidR

1

"Bir Bayesian gibi düşün, sık görüşmeci gibi kontrol et" gibi sesler, birinin istatistiksel tasarım ve analiz konusundaki yaklaşımını ifade eder. Anladığım kadarıyla, Bayesian düşüncesi önceki durumlar hakkında (deneysel ya da istatistiksel olarak) bir miktar inancı içerir, örneğin 4. sınıf öğrencilerinin ortalama okuma puanlarının dakikada 80 kelime olduğunu ve bazı müdahalelerin bunu dakikada 90 kelimeye çıkarabileceğini söyleyelim. . Bunlar önceki çalışmalara ve hipotezlere dayanan inançlar. Sık görüşme düşüncesi, güven aralıklarını veya bu sonuçların teorik ve pratik sıklığı veya olasılığına dayanan (yani, ne kadar "sıklıkta") dayanan güven aralıklarını veya diğer istatistikleri elde etmek için bulguları (müdahalenin) öngörür. Örneğin, müdahale sonrası okuma skoru dakikada% 91 ila 97 kelimelik bir güven aralığı ile dakikada 91 kelime ve bunun müdahale öncesi puandan farklı bir ilişkili p değeri (olasılık değeri) olabilir. Yani zamanın% 95'i, yeni okuma puanları müdahaleden sonra dakikada 85 ila 97 kelime arasında olacaktı. Bu nedenle, "bir Bayesian gibi düşün" --- yani teorileştir, hipotezleştir, önceki kanıtlara bak ve "sık görüşmeci gibi kontrol et" --- yani, bu deneysel sonuçların ne sıklıkta olacağını ve bunların ne kadar muhtemel olacağını müdahale yerine şans. Yeni okuma puanları, müdahaleden sonra dakikada 85 ila 97 kelime arasında olacaktır. Bu nedenle, "bir Bayesian gibi düşün" --- yani teorileştir, hipotezleştir, önceki kanıtlara bak ve "sık görüşmeci gibi kontrol et" --- yani, bu deneysel sonuçların ne sıklıkta olacağını ve bunların ne kadar muhtemel olacağını müdahale yerine şans. Yeni okuma puanları, müdahaleden sonra dakikada 85 ila 97 kelime arasında olacaktır. Bu nedenle, "bir Bayesian gibi düşün" --- yani teorileştir, hipotezleştir, önceki kanıtlara bak ve "sık görüşmeci gibi kontrol et" --- yani, bu deneysel sonuçların ne sıklıkta olacağını ve bunların ne kadar muhtemel olacağını müdahale yerine şans.


2
Son cümleniz - "bir sıklıkçı gibi kontrol et" bölümü - sık sık yapılan ayarlarla gerçekten alakası yok: Bayesçi tahmin, size "ne sıklıkta" bir şey olmasını beklediğimizi ya da "ne kadar muhtemel" olduğunu söyler ...
Tim
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.