bağlam
Bu, bu soruya biraz benziyor , ancak bunun tam bir kopya olduğunu düşünmüyorum.
Bir bootstrap hipotez testinin nasıl yapılacağına dair talimatlara baktığınızda, genellikle ampirik dağılımı güven aralıkları için kullanmanın iyi olduğu, ancak bir p- elde etmek için boş hipotez altındaki dağılımdan doğru şekilde önyükleme yapmanız gerektiği belirtilir. değer. Örnek olarak, bu sorunun kabul edilen cevabına bakınız . İnternette yapılan genel bir arama çoğunlukla benzer cevaplara yol açıyor gibi görünüyor.
Ampirik dağılıma dayalı bir p-değeri kullanmamanın nedeni, çoğu zaman çeviri değişmezliğimiz olmamasıdır.
Misal
Kısa bir örnek vereyim. Bir madalyonumuz var ve kafa sıklığının 0,5'ten büyük olup olmadığını görmek için tek taraflı bir test yapmak istiyoruz
deneme yapıyoruz ve kafa alıyoruz . Bu test için gerçek p değeri .
Öte yandan 20 kafadan 14'ünü bootstrap yaparsak, ve p = 14 ile binom dağılımından etkin bir şekilde örnek alırız. Bu dağılımı 0,2 çıkararak kaydırdığımızda 0,7 gözlemlenen değerimizi elde edilen ampirik dağılıma göre test ederken çok önemli bir sonuç elde edeceğiz.
Bu durumda tutarsızlık çok küçüktür, ancak test ettiğimiz başarı oranı 1'e yaklaştığında artar.
Soru
Şimdi sorumun gerçek noktasına geleyim: Aynı kusur güven aralıkları için de geçerli. Aslında, bir güven aralığı belirtilen güven seviyesine sahipse, sıfır hipotezi altında parametreyi içermeyen güven aralığı sıfır hipotezini anlamlılık düzeyinde reddetmeye eşdeğerdir .
Ampirik dağılıma dayalı güven aralıkları neden yaygın kabul görüyor ve p-değeri kabul edilmiyor?
Daha derin bir neden var mı yoksa insanlar güven aralıklarında o kadar muhafazakar değil mi?
Bu cevapta Peter Dalgaard tartışmamla aynı fikirde gibi görünen bir cevap veriyor. Diyor:
Bu akıl yürütme çizgisi hakkında özellikle yanlış bir şey yoktur veya en azından CI'nin hesaplanmasından daha kötü değildir.
(Çok) nereden geliyor? Bu şekilde p-değerleri üretmenin biraz daha kötü olduğunu, ancak bu konuda ayrıntılı olmadığını ima eder.
Son düşünceler
Ayrıca Efron ve Tibshirani tarafından Bootstrap'a Giriş'te, güven aralıklarına çok fazla alan ayırırlar, ancak genel eşdeğerliği hakkında bir tek kullanımlık çizgi hariç, uygun bir sıfır hipotez dağılımı altında üretilmedikçe p-değerlerine değil. permütasyon testi ile ilgili bölümde güven aralıkları ve p-değerleri.
Bağlantı verdiğim ilk soruya da geri dönelim . Michael Chernick'in cevabına katılıyorum, ancak yine ampirik bootstrap dağılımına dayanan güven aralıklarının ve p değerlerinin bazı senaryolarda eşit derecede güvenilmez olduğunu savunuyor. Neden birçok insanın aralıkların iyi olduğunu söyleyen birisini bulduğunuzu açıklamıyor, ancak p-değerleri iyi değil.