Olasılık ilkesi ile çatışan Frequentist yaklaşımın bir kısmı, istatistiksel test teorisi (ve p-değeri hesaplaması). Genellikle aşağıdaki örnekle vurgulanır.
İki frequentist önyargılı bir sikke, okumak istiyorum varsayalım ki bilinmeyen başarı oranını ile döner 'başları' . Bunlar aynı Boş hipotez önerme bu yüzden, 'kuyruk' doğru bastırılmaktadır şüpheli p = 1 / 2 ve aynı alternatif hipotez p < 1 / 2 .pp=1/2p<1/2
İlk istatistikçi, 'kafalar' ortaya çıkana kadar madeni parayı çevirir, bu da 6 kez olur. İkincisi, madeni parayı 6 kez çevirmeye karar verir ve son atışta sadece bir 'kafa' alır.
İlk istatistikçinin modeline göre, p değeri aşağıdaki gibi hesaplanır:
p(1−p)5+p(1−p)6+...=p(1−p)511−p=p(1−p)4.
İkinci istatistikçinin modeline göre, p değeri aşağıdaki gibi hesaplanır:
(61)p(1−p)5+(60)(1−p)6=(5p+1)(1−p)5.
Değiştirme ile 1 / 2 , ilk bulgular, bir p-değeri için eşit 1 / 2 5 = 0.03125 , bir p-değeri eşit ikinci buluntular 7 / 2 x 1 / 2 5 = 0.109375 .p1/21/25=0.031257/2×1/25=0.109375
Farklı sonuçlar aldılar, çünkü farklı şeyler yaptılar, değil mi? Ancak olabilirlik ilkesine göre , aynı sonuca varmaları gerekir. Kısaca, olabilirlik ilkesi, olasılığın çıkarım için önemli olan tek şey olduğunu belirtir. Dolayısıyla buradaki çatışma, her iki gözlemin de orantılı olarak aynı olasılığa sahip olmasından kaynaklanmaktadır (olasılık, orantılılık sabitine kadar belirlenir).p(1−p)5
Bildiğim kadarıyla, ikinci sorunuzun cevabı tartışmalı bir görüş. Şahsen yukarıdaki nedenden dolayı ve bu blog yazısında açıklanan diğerleri için test yapmaktan ve p-değerleri hesaplamaktan kaçınmaya çalışıyorum .
EDIT: Şimdi düşünüyorum, güven aralıklarıyla tahminleri de farklı olacaktır. Aslında modeller farklıysa, CI yapıya göre farklılık gösterir.p