İstatistiksel tarihte söylediklerinizi tam olarak yapmak için iki deneme vardır: Bayes ve Fiducial. RA Fisher iki istatistiksel düşünme okulu kurdu, maksimum olabilirlik metodu etrafında inşa edilen Likelihoodist okul ve başarısızlıkla sonuçlanan ama tam olarak ne istediğini yapmaya çalışan Fiducial.
Neden başarısız olduğuna dair kısa cevap, olasılık dağılımlarının birliğe entegre olmamasıdır. Sonuçta ders, önceki olasılığın, yaratmaya çalıştığınız şeyi yaratmak için gerekli bir şey olmasıydı. Gerçekten, tarihin en büyük istatistikçilerinden birinin yoluna gidiyorsunuz ve diğer büyüklerin birkaçından fazlası bu soruna bir çözüm umuduyla öldü. Bulunursa, çözebilecekleri sorun türleri açısından Bayes yöntemleriyle eşit hipotez yöntemleri uygulardı. Gerçekten de, gerçek ön bilgilerin olmadığı yerler dışında Bayes'i zorlayacaktı.
Ayrıca, bir p-değerinin alternatif için daha yüksek bir olasılığa işaret ettiğini beyanınıza dikkat etmek istersiniz. Bu sadece Fisherian Likelihoodist okulunda geçerlidir. Pearson-Neyman Frequentist okulunda hiç doğru değil. En alttaki bahsiniz Pearson-Neyman bahsi gibi görünürken, p değeriniz Fisherian okulundan geldiği için uyumsuzdur.
Hayırsever olmak için, örneğiniz için yayın yanlılığının olmadığını ve bu nedenle yüksek yanlış bulma oranı oluşturan dergilerde yalnızca önemli sonuçların ortaya çıktığını varsayacağım. Sonuçlara bakılmaksızın, bunu yapılan tüm çalışmaların rastgele bir örneği olarak görüyorum. Bahis oranlarınızın kelimenin klasik de Finetti anlamında tutarlı olmayacağını iddia ediyorum.
De Finetti'nin dünyasında, bahisçi oyuncular tarafından oynanamazsa, kesin bir kayıpla karşı karşıya kalırlarsa, bahis tutarlıdır. En basit yapıda, pastayı kesme sorununun çözümü gibidir. Bir kişi parçayı ikiye böler, ancak diğeri istediği parçayı seçer. Bu yapımda, bir kişi her hipotezdeki bahislerin fiyatlarını ifade eder, ancak diğer kişi bahsi almayı veya satmayı seçer. Özünde, null değerini kısa satabilirsiniz. İdeal olmak için, oranların kesinlikle adil olması gerekir. P değerleri adil oranlara yol açmaz.
Bunu açıklamak için http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf adresindeki Wetzels ve arkadaşlarının çalışmasını düşünün.
Atıf şöyledir: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson ve Eric-Jan Wagenmakers. Deneysel Psikolojide İstatistiksel Kanıtlar: 855 t Test Kullanarak Ampirik Bir Karşılaştırma. Psikolojik Bilime Yaklaşımlar. 6 (3) 291-298. 2011
Bu, önceki dağıtım problemini atlamak için Bayes faktörlerini kullanan 855 yayınlanan t-testinin doğrudan karşılaştırmasıdır. .05 ve .01 arasındaki p değerlerinin% 70'inde, Bayes faktörleri en iyi şekilde anekdottur. Bu, Frequentists tarafından sorunu çözmek için kullanılan matematiksel formdan kaynaklanmaktadır.
Boş hipotez yöntemleri, modelin doğru olduğunu ve yapıları ile olasılık dağılımından ziyade bir minimaks istatistiksel dağılım kullandığını varsayar. Bu faktörlerin her ikisi de Bayes ve Bayes olmayan çözümler arasındaki farklılıkları etkiler. Bayesian yönteminin bir hipotezin posterior olasılığını yüzde üç olarak değerlendirdiği bir çalışma düşünün. P-değerinin yüzde beşin altında olduğunu düşünün. Her ikisi de doğrudur, çünkü yüzde üç yüzde beşten azdır. Bununla birlikte, p değeri bir olasılık değildir. Bir hipotezin doğru veya yanlış olduğu gerçek olasılığı değil, yalnızca verileri görme olasılığı olabilecek maksimum değeri belirtir. Gerçekten, p-değeri yapısı altında, gerçek null ile şanstan kaynaklanan etkiler ve iyi verilerle yanlış null değeri ayırt edemezsiniz.
Wetzel çalışmasına bakarsanız, p değerlerinin ima ettiği oranların Bayes ölçüsünün ima ettiği oranlarla eşleşmediğinin çok açık olduğunu göreceksiniz. Bayes ölçüsü hem kabul edilebilir hem de tutarlı olduğu ve Bayesci olmayanların tutarlı olmadığı için, p-değerleri haritasını gerçek olasılıklarla varsaymak güvenli değildir. Null değerinin geçerli olduğu varsayımı, iyi kapsama olasılıkları sağlar, ancak iyi kumar olasılıkları üretmez.
Neden daha iyi hissetmek için, Cox'un ilk aksiyomunu bir hipotezin akla yatkınlığının gerçek bir sayı ile tanımlanabileceğini düşünün. Örtük olarak, bu, tüm hipotezlerin mantıklılıklarına bağlı gerçek bir sayıya sahip olduğu anlamına gelir. Sıfır hipotez yöntemlerinde, sadece sıfırın mantıklılığına bağlı gerçek bir sayısı vardır. Alternatif hipotezin hiçbir ölçümü yapılmamıştır ve sıfırın doğru olduğu göz önüne alındığında verilerin gözlemlenmesi olasılığının tamamlayıcısı değildir. Aslında, null doğruysa, tamamlayıcı verilere bakılmaksızın varsayımla yanlıştır.
Eğer olasılıkları ölçümünüzün temeli olarak p-değerlerini kullanarak oluşturduysanız, o zaman Bayesci ölçümleri kullanarak Bayesyan her zaman size karşı bir avantaj elde edebilir. Bayesian oranları koyarsa, Pearson ve Neyman karar teorisi bir bahis beyanı verir veya bahis oynamaz, ancak bahis miktarını tanımlayamazlar. Bayesci oranlar adil olduğu için Pearson ve Neyman yöntemini kullanmanın beklenen kazancı sıfır olacaktır.
Gerçekten de, Wetzel çalışması yapmaktan bahsettiğiniz şeydir, ancak 145 daha az bahisle. Tablo 3'e bakarsanız, Frequentist'in null'u reddettiği bazı çalışmalar görürsünüz, ancak Bayesian, olasılığın null olduğunu olumlu buluyor.