Olasılık oranları ve Bayesci model karşılaştırması, sıfır hipotez testine üstün ve yeterli alternatifler sunuyor mu?


13

Kümülatif bir çaba olarak bilim için sıfır hipotez testinin (NHT) kullanımını eleştiren büyüyen istatistikçi ve araştırmacılara yanıt olarak, Amerikan Psikoloji Derneği İstatistiksel Çıkarım Görev Gücü, NHT'yi açıkça yasaklamayı önledi, ancak bunun yerine araştırmacıların NHT'den türetilen p değerlerine ek olarak etki büyüklüklerini bildirir.

Bununla birlikte, etki boyutları çalışmalarda kolayca birikmez. Meta-analitik yaklaşımlar etki büyüklüklerinin dağılımlarını biriktirebilir, ancak etki büyüklükleri tipik olarak belirli bir deneyin verilerinde ham etki büyüklüğü ve açıklanamayan "gürültü" arasında bir oran olarak hesaplanır, yani etki büyüklüklerinin dağılımı yalnızca çalışmalar arasındaki etkinin ham büyüklüğündeki değişkenlik, aynı zamanda çalışmalar arasındaki gürültünün tezahüründeki değişkenlik.

Bunun aksine, etki gücü, olasılık oranları oranının alternatif bir ölçüsü, her bir çalışmaya göre temelde sezgisel yorumlamaya izin verir ve meta-analiz çalışmaları arasında kolayca toplanabilir. Her çalışma içinde, olasılık, etki içermeyen bir modele göre belirli bir etki içeren bir model için kanıt ağırlığını temsil eder ve tipik olarak, örneğin, "X'in etkisi için bir olasılık oranının hesaplanması" olarak rapor edilebilir. etki için ilgili boş değerden 8 kat daha fazla kanıt ortaya koydu ". Ayrıca, olasılık oranı, 1'in altındaki olasılık oranları, sıfırın tercih edildiği senaryoları temsil ettiği ve bu değerin karşılıklı olarak alınmasının, etkinin üzerindeki sıfırın kanıtı ağırlığını temsil ettiği sürece, sıfır bulgularının gücünün sezgisel olarak temsil edilmesine izin verir. Özellikle, olabilirlik oranı, matematiksel olarak iki modelin açıklanamayan varyanslarının oranı olarak temsil edilir, bu sadece etki ile açıklanan varyansta farklılık gösterir ve bu nedenle bir etki boyutundan büyük bir kavramsal ayrılma değildir. Öte yandan, çalışmalar arasında bir etki için kanıt ağırlığını temsil eden bir meta-analitik olabilirlik oranının hesaplanması, basitçe, çalışmalar arasında olabilirlik oranlarının çarpımını ele alma konusudur.

Bu nedenle, bir etki / model lehine brüt kanıt derecesini belirlemeye çalışan bilim için, olasılık oranlarının yol olduğunu iddia ediyorum.

Modellerin yalnızca bir efektin belirli boyutunda farklılaşabileceği daha nüanslı vakalar vardır, bu durumda verilerin efekt parametre değerleriyle tutarlı olduğuna inandığımız aralığın bir çeşit gösterimi tercih edilebilir. Aslında, APA görev gücü de bu amaçla kullanılabilecek güven aralıklarının bildirilmesini önerir, ancak bunun aynı zamanda kötü düşünülmüş bir yaklaşım olduğundan şüpheleniyorum.

Güven aralıkları genellikle yanlış yorumlanmaktadır ( öğrenciler ve araştırmacılar tarafından benzer şekilde ). Ayrıca NHT'de kullanım becerilerinin (CI içine sıfır eklenmesi değerlendirilerek) sadece NHT'nin neslinin tükenmesini çıkarımsal bir uygulama olarak daha da geciktirmeye yarayacağından korkuyorum.

Bunun yerine, teoriler sadece etkilerin büyüklüğüne göre farklılaştığında, Bayes yaklaşımının daha uygun olacağını, her bir etkinin önceki dağılımının her model tarafından ayrı ayrı tanımlandığı ve ortaya çıkan arka dağılımların karşılaştırıldığını öneririm.

P-değerlerini, etki büyüklüklerini ve güven aralıklarını olasılık oranlarıyla ve gerekirse Bayesci model karşılaştırmasını değiştiren bu yaklaşım yeterli görünüyor mu? Burada kötü huylu alternatiflerin sağladığı bazı çıkarımsal özellikleri kaçırıyor mu?


Daha odaklanmış bir soru olabilir mi? Belki de belirli bir çıkarım problemine olasılık odaklı yaklaşımlar hakkında?
konjugateprior

2
Ama biz buradayken: Fuarda: tam bir model için karşılaştırmalı kanıt ölçümleri için genellikle bir parametre ile tanımlanan etki büyüklüğü ölçümlerini karıştırdınız mı? LR'ler sadece ikincisi için aday gibi görünür. Ayrıca, Olabilirlik işlevlerinin tek başına veya kombinasyon halinde verilerin size bir model hakkında anlatmaya çalıştığı her şeyi anlatmasını istiyorsanız, temelde bir Bayesinizdir. Çünkü Olabilirlik İlkesi. (İçeri gel, suyun güzel :-)
eşlenik

Başlığınız ve sonuç paranız güven aralıkları kullanmayı veya değiştirmeyi önerdiğiniz konusunda aynı fikirde değil gibi görünüyor.
onestop

@onestop: gerçekten, sadece başlığı değiştirmeyi unuttuğumu fark ettim; Soruyu yazarken güven aralıklarıyla ilgili fikrimi değiştirdim. Başlığı şimdi düzenledim. Karışıklık için özür dileriz.
Mike Lawrence

@ Conjugate Prior: İlk iki cümlenizi tamamen kabul edin. Ancak , öncelikler fikrini sevmiyorsanız ve sadece olasılıklar üzerine temel çıkarımdan hoşlanmıyorsanız, olasılık ilkesini kabul edebilirsiniz - Edwards books.google.com/books?id=2a_XZ-gvct4C ve Royall books.google .com / books? id = oysWLTFaI_gC . Birisi (ve ben kim ve nerede hatırlıyorum rağmen) bir kez bu yumurta kırma ama omlet yemek değil sevdim.
onestop

Yanıtlar:


3

En azından Psikoloji araştırmacısı olarak Bayesci bir yaklaşımın başlıca avantajları:

1) null lehine kanıt biriktirmenizi sağlar

2) ardışık testlerin teorik ve pratik problemlerini atlar

3) sadece büyük bir N nedeniyle boş değeri reddetmeye açık değildir (önceki noktaya bakın)

4) küçük efektlerle çalışırken daha uygundur (hem Frequentist hem de Bayesian yöntemleri büyük etkilerle her zaman hemen hemen aynı fikirde olma eğilimindedir)

5) hiyerarşik modellemenin uygulanabilir bir şekilde yapılmasına izin verir. Örneğin, Multinomial Processing Tree modelleri gibi bazı model sınıflarına madde ve katılımcı efektleri getirmenin Bayesci bir çerçevede yapılması gerekir, aksi takdirde hesaplama süresi çok uzun olur.

6) size "gerçek" güven aralıkları verir

7) 3 şeye ihtiyacınız vardır: verilerin olasılığı, önceliği ve olasılığı. verilerinizden birincisi, ikincisini telafi edersiniz ve üçüncüsü, herhangi bir orantılılığa ihtiyaç duymazsınız. Tamam, belki biraz abartıyorum ;-)

Genel olarak, sorunuzu tersine çevirebilir: Bu, klasik frekansçı istatistiklerin yeterli olmadığı anlamına mı geliyor? "Hayır" demenin çok sert bir karar olduğunu düşünüyorum. Biri p değerlerinin ötesine geçip etki boyutları, madde efektleri olasılığı ve bulguları tutarlı bir şekilde tekrarlarsa (çok fazla tek deneme makalesi yayınlanır!)

Ama Bayes ile her şey o kadar kolay değil. Örneğin, iç içe yerleştirilmemiş modellerle model seçimini ele alalım. Bu durumlarda, öncelikler sonuçları büyük ölçüde etkilediği için son derece önemlidir ve bazen önceliklerinizi doğru yapmak için birlikte çalışmak istediğiniz modellerin çoğunda bu kadar fazla bilgiye sahip olmazsınız. Ayrıca, çok uzun sürer ....

Bayes'e dalmak isteyen herkes için iki referans bırakıyorum.

Lee ve Wagenmakers'ın "Bilişsel Bilimler İçin Bayes Grafik Modellemesinde Bir Kurs"

"WinBUGS Kullanarak Bayesci Modelleme" Ntzoufras

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.