Bayesci istatistikler gerçekten davranışsal araştırmalar için geleneksel (frekansçı) istatistiklere göre bir gelişme mi?


19

Konferanslara katılırken Bayes istatistiklerinin savunucuları tarafından deneylerin sonuçlarını değerlendirmek için biraz baskı yapıldı. Sık rastlanan istatistiklere göre gerçek bulgulara (daha az yanlış pozitif) karşı hem daha duyarlı, uygun hem de seçici olarak tanımlanmaktadır.

Konuyu biraz araştırdım ve Bayesian istatistiklerini kullanmanın yararlarından şimdiye kadar ikna olmadım. Ancak Daryl Bem'in algılamayı destekleyen araştırmalarını çürütmek için Bayesian analizleri kullanıldı , bu yüzden Bayesian analizlerinin kendi araştırmamda bile nasıl fayda sağlayabileceği konusunda ihtiyatlı bir şekilde merak ediyorum.

Bu yüzden aşağıdakileri merak ediyorum:

  • Bayesci analizde güç ve sıkça yapılan analiz
  • Her analiz türünde Tip 1 hatasına duyarlılık
  • Analizin karmaşıklığı (Bayes, daha karmaşık görünüyor) ve kazanılan faydalar. Geleneksel istatistiksel analizler açıktır ve sonuç çıkarmaya yönelik iyi belirlenmiş kılavuz ilkelerdir. Basitlik bir fayda olarak görülebilir. Vazgeçmeye değer mi?

Herhangi bir fikir için teşekkürler!


1
Bayesci istatistik geleneksel istatistiktir - geleneksel istatistik demek istediğinize somut bir örnek verebilir misiniz?

1
@OphirYoktan: Bayes olasılığına karşı frekans olasılığı hakkında konuşuyor. Sorunun başlığında bile bahsedildi.

5
Bu sorunun buraya taşınması gerektiğini düşünüyorum: stats.stackexchange.com
Mark Lapierre

2
Meta hakkında bunun konuyla ilgili olup olmadığı hakkında bir soru sordum .

1
Bu sorunun potansiyel olarak "iyi" veya "doğru" bir cevabı olabileceğini düşünüyorum. Örneğin, birisi "tip 1 hatası ve tip 2 hatası olan her sık ​​test için" 1 tipi hata ve tip 2 hatası " olan bir Bayes testi vardır , bu iyi bir cevap olacaktır . Ya da "her sıklık testi daha önce bilgi vermeyen bir Bayes testine eşittir" gibi bir şey. Yani bu, sık sık ve bayiler arasında dini bir savaş olmak zorunda değil. Sadece tartışıyorum çünkü cevapların OP'deki belirli sorularla nasıl ilişkili olduğunu anlamıyorum. β α β - xαβαβx
SheldonCooper

Yanıtlar:


14

Madde işaretli içeriğe hızlı bir yanıt:

1) Bayesci analizde güç / Tip 1 hatası ve sık analiz

Tip 1 ve güç hakkında soru sormak (bir eksi Tip 2 hata olasılığı), çıkarım probleminizi tekrarlanan bir örnekleme çerçevesine koyabileceğiniz anlamına gelir. Yapabilir misin? Eğer yapamıyorsanız, sık sık çıkarım araçlarından uzaklaşmaktan başka seçenek yoktur. Yapabiliyorsanız ve tahmincinizin bu tür birçok örnek üzerindeki davranışı uygunsa ve özellikle belirli olaylar hakkında olasılık ifadeleri yapmakla ilgilenmiyorsanız, hareket etmenin güçlü bir nedeni yoktur.

Buradaki argüman, bu tür durumların asla ortaya çıkmadığı - kesinlikle öyledir - fakat yöntemlerin uygulandığı alanlarda genellikle ortaya çıkmadıklarıdır.

2) Analizin karmaşıklığı (Bayes, daha karmaşık görünüyor) ve kazanılan faydalar.

Karmaşıklığın nereye gittiğini sormak önemlidir. Sık prosedürlerde uygulama çok basit olabilir, örneğin karelerin toplamını en aza indirgeyebilir, ancak prensipler keyfi olarak karmaşık olabilir, tipik olarak hangi tahmin edicilerin seçileceği, doğru testlerin nasıl bulunacağı, ne zaman düşünüleceği katılmıyorlar. Örneğin. bir oran için farklı güven aralıklarının bu forumda alınan hala canlı tartışmasına bakın!

Bayesci prosedürlerde uygulama , basit olması gerektiği gibi basit olması gereken modellerde bile keyfi olarak karmaşık olabilir, ancak prensipler son derece basittir. Bu daha çok dağınıklığın olmasını istediğiniz yere bağlıdır.

3) Geleneksel istatistiksel analizler açıktır ve sonuçlar çıkarmaya yönelik iyi kurulmuş kılavuz ilkeler vardır.

Şahsen ben artık hatırlamıyorum, ama kesinlikle benim öğrenciler asla ilke çoğalması yukarıda açıklanan çoğunlukla nedeniyle, bu basit buldum. Ancak soru, bir prosedürün basit olup olmadığı değil, sorunun yapısı göz önüne alındığında doğru olmaya daha yakın olup olmadığıdır.

Son olarak, her iki paradigmada da “sonuç çıkarmak için iyi kurulmuş kılavuz ilkeler” olduğuna kesinlikle katılmıyorum. Ve bence bu iyi bir şey. Elbette, "find p <.05" açık bir kılavuzdur, ancak hangi model için, hangi düzeltmelerle vb.? Testlerim katılmıyorsa ne yapmam gerekir? Bilimsel ya da mühendislik yargısı, başka yerlerde olduğu gibi burada gereklidir.


Tip 1 / tip 2 hataları sormak tekrarlanan örnekleme çerçevesi hakkında bir şey ima emin değilim. Sıfır hipotezim tekrar tekrar örneklenemese bile, tip 1 hata olasılığını sormak hala anlamlı. Bu durumda olasılık elbette tüm olası hipotezlerin değil, benim tek hipotezimdeki tüm olası örneklerin üzerindedir.
SheldonCooper

Bu genel argüman şudur geliyor bana: Bir tip 1 (veya 2) hata yapma rağmen edebilirsiniz sürece (I yapabilir hatalar tipolojisinin sadece bir parçasıdır 2'ye karşılık Tip 1 de) bir 'tek atış' çıkarım için tanımlanabilir benim bu hatanın tekrarlanan denemelere gömülmesi, ne hata türünün ne sık rastlanan bir olasılığı olamaz.
konjugateprior

Dediğim şey, bir tip 1 (veya 2) hatası yapmanın her zaman tekrarlanan denemelere gömülmüş olmasıdır. Her deneme, sıfır hipotezinden bir dizi gözlemi örneklemektedir. Dolayısıyla, farklı bir hipotezi örneklemeyi hayal etmek zor olsa da, tekrarlanan denemeler hala oradadır, çünkü aynı hipotezden farklı bir dizi gözlemi örneklemeyi hayal etmek kolaydır.
SheldonCooper

1
Bana şunu söyle: "rastgele nedir?" Örneğin, bir urnunuz olduğunu varsayalım, birisi urndan "rastgele" örnekliyor. Ayrıca bir "akıllı gözlemci" de bulunduğunu ve urn'un tam içeriğini bildiğini varsayalım. "Akıllı gözlemci" tam olarak ne çizileceğini kesin olarak tahmin edebilse de örnekleme hala "rastgele" mi? Artık mevcut değilse urn hakkında bir şey değişti mi?
olasılık

1
Sıkların "tekrarlanan" doğasıyla ilgili sorunum, çalışmak için koşulların aynı kalması gerektiğidir. Ancak koşullar aynı kalırsa, veri kümelerinizi bir araya toplayabilmeniz ve daha iyi bir tahmin alabilmeniz gerekir. Sıklık, geçmiş bilgileri dikkate almanın makul olduğu koşullar altında tam olarak göz ardı eder.
olasılık

5

Bayesci istatistikler birkaç Mantıksal ilkeden elde edilebilir. "Olasılığını genişletilmiş mantık olarak" aramayı deneyin ve temel bilgilerin daha ayrıntılı analizini bulacaksınız. Ancak temel olarak, Bayesci istatistik üç temel "desiderata" veya normatif prensibe dayanmaktadır:

  1. Bir teklifin akla yatkınlığı, tek bir gerçek sayı ile temsil edilecektir.
  2. p(bir|C(0))C(0)C(1)p(bir|C(1))>p(bir|C(0))p(B|birC(0))=p(B|birC(1))p ( ¯ A | C ( 1 ) ) < p ( ¯ A | C ( 0 ) )p(birB|C(0))p(birB|C(1))p(bir¯|C(1))<p(bir¯|C(0))
  3. Bir teklifin makul olması tutarlı bir şekilde hesaplanmalıdır . Bu, a) bir akla yatkınlığın 1'den fazla bir şekilde akla getirilebileceği durumlarda, tüm cevaplar eşit olmalıdır; b) Aynı bilginin verildiği iki problemde, aynı olasılıkları atamalıyız; ve c) mevcut olan tüm bilgileri dikkate almalıyız. Orada olmayan bilgileri eklememeliyiz ve sahip olduğumuz bilgileri göz ardı etmemeliyiz.

Bu üç desiderata (mantık ve küme teorisi kuralları ile birlikte) olasılık teorisinin toplamını ve ürün kurallarını benzersiz bir şekilde belirler. Yukarıdaki üç istekler göre nedenden istiyorsanız Böylece, onlar gereken bir Bayes yaklaşımı benimsemek. "Bayes Felsefesi" ni benimsemek zorunda değilsiniz, ancak sayısal sonuçları benimsemek zorundasınız. Bu kitabın ilk üç bölümü bunları daha ayrıntılı olarak açıklamakta ve kanıt sağlamaktadır.

Ve son olarak, en önemlisi, "Bayesian makineleri" sahip olduğunuz en güçlü veri işleme aracıdır. Bu esas olarak desiderata 3c'den kaynaklanmaktadır) sahip olduğunuz tüm bilgileri kullanmaktır (bu aynı zamanda Bayes'in Bayes dışındaki neden daha karmaşık olabileceğini de açıklar). Sezginizi kullanarak "neyin önemli olduğuna" karar vermek oldukça zor olabilir. Bayes teoremi bunu sizin için yapar (ve 3c nedeniyle de rastgele varsayımlar eklemeden yapar).

'H0'H1L1'H0L2'H0

  1. P('H0|E1,E2,...)Eben
  2. P('H1|E1,E2,...)
  3. Ö=P('H0|E1,E2,...)P('H1|E1,E2,...)
  4. 'H0Ö>L2L1

'H0Ö>>1'H1Ö<<1Ö1

Şimdi hesaplama "çok zor" hale gelirse, sayılara yaklaşık olarak yaklaşmanız veya bazı bilgileri yok saymanız gerekir.

Üzerinde çalışılan sayıların bulunduğu gerçek bir örnek için bu soruya verdiğim cevaba bakınız


3
Bunun soruyu nasıl cevapladığından emin değilim. Tabii ki, sık sık bu listeden desideratum 1'e katılmıyorum, bu nedenle argümanın geri kalanı onlar için geçerli değildir. Aynı zamanda OP'deki "Bayes analizi sıkça yapılan bir analizden daha güçlü veya daha az hataya açık mı?" Gibi belirli soruları yanıtlamaz.
SheldonCooper

@sheldoncooper - eğer bir frekansçı desideratum 1'e katılmazsa, o zaman hangi temelde% 95 güven aralığı oluşturabilirler? Ek bir numara gerektirmelidirler.
olasılık

@sheldoncooper - ve ayrıca örnekleme olasılıklarının yeniden tanımlanması gerekir, çünkü onlar da sadece 1 sayıdır. Bir frekansçı, desideratum 1'i kendi teorilerini reddetmeden reddedemez
olasılık

1
p('H1|...)p(E1,E2,...|'H0)'H0

1
"Desideratum 1'i kendi teorilerini reddetmeden reddedemezler" - bununla ne demek istiyorsun? Sıkların "akla yatkınlık" fikri yoktur. "Tekrarlanan çalışmalarda görülme sıklığı" nosyonu vardır. Bu sıklık üç desiderata benzer koşulları karşılar ve böylece benzer kurallara uyar. Böylece, frekans kavramının tanımlandığı her şey için, olasılık yasalarını sorunsuz bir şekilde kullanabilirsiniz.
SheldonCooper

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.