Olabilirlik ilkesi sık sık olasılıkla çatışırsa, bunlardan birini atar mıyız?


19

Yakın zamanda burada yayınlanan bir yorumda, bir yorumcu, Larry Wasserman'ın (herhangi bir kaynak olmadan), sık sık çıkarımın olasılık ilkesi ile çatıştığına dikkat çeken bir bloga işaret etti .

Olabilirlik ilkesi basitçe benzer olabilirlik fonksiyonlarını veren deneylerin benzer çıkarım vermesi gerektiğini söyler.

Bu sorunun iki kısmı:

  1. Hangi bölümler, lezzet veya sık sık çıkarım yapan okullar özellikle olasılık ilkesini ihlal eder?

  2. Bir çatışma varsa, birini mi yoksa diğerini mi atmalıyız? Eğer öyleyse, hangisi? Tartışma uğruna, bir şeyi atmak zorunda kalırsak, sık sık çıkarım yapan kesişen kısımları atmamız gerektiğini önereceğim çünkü Hacking ve Royall , olasılık ilkesinin aksiyomatik olduğuna ikna oldular.


2
Olasılık ilkesinin neden bir aksiyom olması gerektiğini asla anlamadım.
Stéphane Laurent

6
Merhaba Stéphane. Sorun şu ki, Birnbaum, Olabilirliğin zorunlu olarak sahip olması gereken doğal olan diğer iki ilkeye eşdeğer olduğunu kanıtladı. Bu sonuç hakkında kısa bir inceleme yazdık. Burada: ime.usp.br/~pmarques/papers/redux.pdf
Zen

@Zen Teşekkürler. İlk bakışta katılmıyorum nokta koşulluluk ilkesinin altında yazılan bu cümledir: "Önemli olan aslında olan şeydir". Bunun yerine "Önemli olan, oluşabilecek sorunlar arasında gerçekte ne olduğudur" demeliyim (İngilizcem doğru değilse özür dilerim). Gui11aume ile yaptığım tartışmada iddia ettiğim şey budur: belli bir anlamda olabilirlik ilkesi deneyin tasarımının önemli olmadığını iddia ediyor ve bu noktaya katlanamıyorum.
Stéphane Laurent

1
@Zen Artık makalenizi daha dikkatli okudum. Koşulluluk ilkesine ve değişmezlik ilkesine katılmamak zor.
Stéphane Laurent

1
LP günümüzde pratik nedenlerle o kadar popüler değil. Dini olarak benimseyerek, Jeffreys'in önceki, eşlenik öncelikleri ve birçok bağlamda yararlı olabilecek hipotez testleri gibi modele bağlı önceliklerin kullanılmasından kaçınırsınız. Bunu istatistikler, inan fiziği ile aynı (bu tartışma gibi gelebilir, ancak anlamlı bir şekilde axiomatised edilemez bu ). Ancak, farklı paradigmaların avantaj ve dezavantajlarını belirlemek önemlidir.

Yanıtlar:


12

Olasılık ilkesi ile çatışan Frequentist yaklaşımın bir kısmı, istatistiksel test teorisi (ve p-değeri hesaplaması). Genellikle aşağıdaki örnekle vurgulanır.

İki frequentist önyargılı bir sikke, okumak istiyorum varsayalım ki bilinmeyen başarı oranını ile döner 'başları' . Bunlar aynı Boş hipotez önerme bu yüzden, 'kuyruk' doğru bastırılmaktadır şüpheli p = 1 / 2 ve aynı alternatif hipotez p < 1 / 2 .pp=1/2p<1/2

İlk istatistikçi, 'kafalar' ortaya çıkana kadar madeni parayı çevirir, bu da 6 kez olur. İkincisi, madeni parayı 6 kez çevirmeye karar verir ve son atışta sadece bir 'kafa' alır.

İlk istatistikçinin modeline göre, p değeri aşağıdaki gibi hesaplanır:

p(1p)5+p(1p)6+...=p(1p)511p=p(1p)4.

İkinci istatistikçinin modeline göre, p değeri aşağıdaki gibi hesaplanır:

(61)p(1p)5+(60)(1p)6=(5p+1)(1p)5.

Değiştirme ile 1 / 2 , ilk bulgular, bir p-değeri için eşit 1 / 2 5 = 0.03125 , bir p-değeri eşit ikinci buluntular 7 / 2 x 1 / 2 5 = 0.109375 .p1/21/25=0.031257/2×1/25=0.109375

Farklı sonuçlar aldılar, çünkü farklı şeyler yaptılar, değil mi? Ancak olabilirlik ilkesine göre , aynı sonuca varmaları gerekir. Kısaca, olabilirlik ilkesi, olasılığın çıkarım için önemli olan tek şey olduğunu belirtir. Dolayısıyla buradaki çatışma, her iki gözlemin de orantılı olarak aynı olasılığa sahip olmasından kaynaklanmaktadır (olasılık, orantılılık sabitine kadar belirlenir).p(1p)5

Bildiğim kadarıyla, ikinci sorunuzun cevabı tartışmalı bir görüş. Şahsen yukarıdaki nedenden dolayı ve bu blog yazısında açıklanan diğerleri için test yapmaktan ve p-değerleri hesaplamaktan kaçınmaya çalışıyorum .

EDIT: Şimdi düşünüyorum, güven aralıklarıyla tahminleri de farklı olacaktır. Aslında modeller farklıysa, CI yapıya göre farklılık gösterir.p


1
Sıklık istatistiklerinde (hipotez testi, güven aralıkları) olasılık ilkesinin açıkça ihlal edildiği izlenimindeyim çünkü sadece gerçek sonuca bağlı olma olasılığını değil, her olası sonucun olasılığını da dikkate alıyoruz. Sağ ?
Stéphane Laurent

@ Stéphane Laurent evet, ben de öyle anlıyorum. James Berger, İstatistiksel Karar Teorisi ve Bayesci Analiz'de güzel bir alıntıya sahiptir ;
gui11aume

Teşekkürler gui11aume. Bunu, P-değerlerinin 'anlamının' deneycinin amacına göre değiştiği bir örnek olarak yorumlamakta mıyım? P-değerleri bir tür eşik yanlış pozitif hata oranı olarak yorumlandığında, null hipotezi altında eşit olarak dağıtılmaları gerektiği için bu durumda olduğunu varsayıyorum? P-değerlerinin kanıt gücünün endeksleri olarak sunulduğu Fisher yaklaşımı için buna gerek var mı?
Michael Lew

4
(+1) Bu tür tutarsızlıklar genellikle modellerden birinde durdurma kuralı söz konusu olduğunda ortaya çıkar .

1
@Scortchi Aslında P-değerlerinden birinin doğru olabilirlik fonksiyonunu gösterdiğini, diğerinin değil: her ikisi de kafaların olasılığı ile ilgili kanıtları sunan aynı olasılık fonksiyonuna işaret ettiğini düşünmüştüm. Önceki yorumumun son iki cümlesini görmezden gelmelisin. (Düzenleyemiyorum, yapabilir miyim?)
Michael Lew

4

@ Gui11aume (+1) örneğini beğendim, ancak iki - değerindeki farkın sadece iki deneyci tarafından kullanılan farklı durma kuralları nedeniyle ortaya çıktığı izlenimini verebilir .p

Aslında, bunun çok daha genel bir fenomen olduğuna inanıyorum. @ Gui11aume'un cevabındaki ikinci deneyi düşünün: altı kez bozuk para atan ve sadece son atışta kafaları gözlemleyen. Sonuçlar şöyle görünür: nedir p -değeri? Olağan yaklaşım, adil bir madalyonun bir veya daha az kafa ile sonuçlanma olasılığını hesaplamak olacaktır. Var 7 toplam üzerinden olanakları 64 , bir ya da daha başları, dolayısıyla p = 7 / 64 0.109 .

TTTTTH,
p764p=7/640.109

3p=3/640.047

α=0.05


Spekülatif kısım

Şimdi, felsefi olarak, test istatistiğinin sıkça tercih edilmesinin, Bayeseli olan önceki seçime benzer bir şekilde belirsiz olduğunu söyleyebilirim. Bir veya başka bir test istatistiği seçiyoruz, çünkü haksız madalyonun bu veya bu şekilde davranacağına inanıyoruz (ve bu davranışı tespit etme gücüne sahip olmak istiyoruz). Bozuk para türlerini önceden koymaya benzemiyor mu?

ppp

Burada veya sohbette bu spekülatif kısım hakkında bazı görüşler duymak isterim.


@MichaelLew ile tartışmayı güncelleyin

ppp

Yukarıdaki "spekülatif" bölümüm için bunun ne anlama geldiğini hala düşünmeliyim.


İlginç düşünceler. Evet, P-değerleri olasılık işlevi gibi kanıt olarak yorumlanmadığı sürece LP ve P-değerleri arasında çatışma olmaması gerektiğine katılıyorum . Olabilirlik fonksiyonu , istatistiksel model göz önüne alındığında, ilgilenilen parametreyle ilgili kanıtları içerir . Test istatistiğini değiştirdiğinizde, modeli değiştirirsiniz, böylece alternatif modeliniz için olasılık işlevi, orijinalin olabilirlik işlevinden farklı olabilir (iyi olabilir).
Michael Lew

p

Bunun dışında bu soruyu buldum çünkü "P'ye ya da P'ye değil" kağıdınızı tekrar okuyordum (ve googled "olasılık ilkesi"). Genelde gazeteyi severim, ama bölüm 4.4'ü tamamen karıştırdım. Durdurma kuralları dikkate alınarak p-değerlerinin "ayarlanmaması" gerektiğini yazarsınız; ancak 5-6 formüllerinde herhangi bir ayarlama görmüyorum. "Düzeltilmemiş" p-değerleri ne olurdu? Yani bunlardan biri ayarlanmış, diğeri ayarlanmamış mı? Eğer öyleyse, hangisi ve neden tam tersi değil?
amip, Reinstate Monica'yı

İstatistiksel model genellikle göz ardı edilir veya değişmez olduğu varsayılır. Bununla birlikte, madeni paralar için sabit bilinmeyen bir kafa olasılığı, rastgele bir gözlem seçimi ve denemeler için test istatistiği için olası sonuçların binom dağılımını içerir. Bir sıra testi istatistiğindeki kuyruklar için sonuçların dağılımının ne olduğunu bilmiyorum ama farklı olduğundan şüpheleniyorum. Aynı olsa bile, test istatistiğinize sahip olan model orijinal ile aynı model değildir ve bu nedenle tüm kanıtları içermesine rağmen olabilirlik işlevi farklı olabilir.
Michael Lew

Neredeyse bu makalenin tamamen yeniden işlenmesi bitti. Bu tartışma ile ilgilidir, ancak henüz sunulmaya hazır değildir. (Bu sohbet mi?)
Michael Lew
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.