Bir p değeri rastgele bir değişkendir.
altında (en azından sürekli dağıtılmış bir istatistik için), p-değerinin düzgün bir dağılımı olmalıdırH0
Tutarlı bir test için, altında numune boyutları sonsuza doğru arttıkça p değeri sınırda 0'a gitmelidir. Benzer şekilde, etki büyüklükleri arttıkça p-değerlerinin dağılımları da 0'a kayma eğiliminde olmalıdır, ancak her zaman "yayılacaktır".H1
"Gerçek" bir p değeri kavramı bana saçma geliyor. O da altında, ne anlama gelir veya H 1 ? Örneğin, " belirli bir etki büyüklüğü ve örneklem büyüklüğünde p-değerlerinin dağılımının ortalaması" demek istediğinizi söyleyebilirsiniz , ancak o zaman yaymanın büzülmesi gereken yakınsama nasıldır? Sabit tutarken örnek boyutunu artırabileceğiniz gibi değil.H0H1
Burada bir numune t-testi ve altında küçük bir etki boyutu ile bir örnek . Numune boyutu küçük olduğunda p değerleri hemen hemen eşittir ve numune boyutu arttıkça dağılım yavaşça 0'a konsantre olur.H1
P değerlerinin tam olarak böyle davranması gerekiyordu - yanlış bir boş için, örnek boyutu arttıkça, p değerleri düşük değerlerde daha konsantre hale gelmelidir, ancak değerlerin dağılımını, tip II hatası yapın - p değeri önem seviyenizin ne olursa olsun - bir şekilde bu önem seviyesine "yakın" olmalıdır.
α=0.05
Hem alternatif altında kullandığınız test istatistiği ne olursa olsun ne olduğunu ve null altındaki cdf'yi dağıtıma yapılacak bir dönüşüm olarak uygulayan (p değerinin dağılımını verecek) ile neler olduğunu düşünmek genellikle yararlı olur. belirli bir alternatif). Bu terimlerle düşündüğünüzde, davranışın neden olduğu gibi olduğunu görmek genellikle zor değildir.
Gördüğüm kadarıyla sorun, p-değerleri veya hipotez testleriyle ilgili herhangi bir doğal sorun olmadığı kadar çok değil, daha çok hipotez testinin özel probleminiz için iyi bir araç olup olmadığı veya başka bir şeyin daha uygun olup olmayacağı herhangi bir özel durumda - bu geniş fırça polemikleri için bir durum değil, hipotez testlerinin ele aldığı soru türlerini ve durumunuzun özel ihtiyaçlarını dikkatle ele alır. Ne yazık ki bu konuların dikkatle değerlendirilmesi nadiren yapılır - çoğu zaman biri "bu veriler için hangi testi kullanırım?" Şeklinde bir soru görür. ilgilenilen sorunun ne olabileceğine bakılmaksızın, bazı hipotez testlerinin bunu ele almanın iyi bir yolu olup olmadığını düşünelim.
Bir zorluk, hipotez testlerinin hem yaygın olarak yanlış anlaşılması hem de yaygın olarak yanlış kullanılmasıdır; insanlar bize genellikle yapmadıkları şeyleri söylediklerini düşünürler. P değeri muhtemelen hipotez testleri ile ilgili en yanlış anlaşılan şeydir.