|x¯−100|
Fisher , p-değerinin , sıfır hipotezine karşı sürekli bir kanıt ölçüsü olarak yorumlanabileceğini düşündü . Sonuçların “anlamlı” hale geldiği belirli bir sabit değer yoktur. Bunu genel olarak insanlara karşı koymaya çalışmamın yolu, tüm niyet ve amaçlar için, p = 0,049 ve p = 0,051'in boş hipoteze karşı aynı miktarda kanıt oluşturduğuna işaret etmektir (cf. @ Henrik'in buradaki cevabı ). .
Öte yandan, Neyman ve Pearson , p değerini resmi bir karar alma sürecinin parçası olarak kullanabileceğinizi düşündü . Araştırmanızın sonunda, boş hipotezi reddetmeniz veya boş hipotezi reddetmeniz gerekmiyor. Ayrıca, boş hipotez ya doğru olabilir ya da doğru olmayabilir. Böylece, dört teorik olasılık vardır (herhangi bir durumda, sadece iki tane olmasına rağmen): doğru bir karar verebilirsin (doğru - veya yanlış - boş hipotezi reddedemezsin) ya da bir tür yapabilirsin I veya II tipi hata (sırasıyla boş bir boş hipotezi reddederek ya da yanlış bir boş hipotezi reddederek). (P-değerinin burada tartıştığım I tipi hata oranı ile aynı olmadığını unutmayın..) P-değeri, sıfır hipotezinin resmileştirilmesinin reddedilip reddedilmeyeceğine karar verme sürecine izin verir. Neyman-Pearson çerçevesinde, süreç şöyle işe yarayacaktı: tersine yeterli delil olmadığında insanların varsayılan olarak inanacakları gibi boş bir hipotez ve bunun yerine doğru olabileceğine inandığınız alternatif bir hipotez var. Birlikte yaşamak isteyeceğiniz bazı uzun vadeli hata oranları var (bunların% 5 ve% 20 olması gerekmediğine dikkat edin). Bu şeyler göz önüne alındığında, çalışmanızı bu iki hipotez arasında ayrım yaparken, en çok bu hata oranlarını koruyarak, bir güç analizi yaparak ve çalışmanızı buna göre yürüterek tasarlarsınız. (Genellikle, bu yeterli veriye sahip demektir.) Çalışmanız tamamlandıktan sonra, p-değerini karşılaştırın.αp<α
Fisherian ve Neyman-Pearson yaklaşımları aynı değildir . Neyman-Pearson çerçevesinin temel çekişmesi, çalışmanızın sonunda bir karar vermeniz ve çekip gitmeniz gerektiğidir. İddiaya göre, bir araştırmacı bir zamanlar Fisher'a 'önemli olmayan' sonuçlarla yaklaştı, ne yapması gerektiğini sordu ve Fisher “git daha fazla veri bul” dedi.
Şahsen, Neyman-Pearson yaklaşımının zarif mantığını çok çekici buluyorum. Ama her zaman uygun olduğunu sanmıyorum. Benim düşünceme göre, Neyman-Pearson çerçevesi göz önüne alınmadan önce en az iki koşulun karşılanması gerekir:
- Bazı nedenlerden dolayı önemsediğiniz bazı spesifik alternatif hipotezler ( etki büyüklüğü ) olmalıdır. (Etki büyüklüğünün ne olduğu, nedeninizin ne olduğu, sağlam temelli mi yoksa tutarlı mı olduğu umurumda değil.
- Alternatif hipotez doğruysa, etkinin 'önemli' olacağından şüphelenmek için bazı sebepler olmalıdır. (Uygulamada, bu genellikle bir güç analizi yaptığınız ve yeterli veriye sahip olduğunuz anlamına gelir.)
Bu koşullar karşılanmadığında, p-değeri hala Fisher'ın fikirlerine uygun olarak yorumlanabilir. Üstelik, bu şartların çoğu zaman karşılanmadığı da muhtemel görünüyor. İşte testlerin yapıldığı aklınıza gelen bazı basit örnekler, ancak yukarıdaki şartların yerine getirilmediği:
- çoklu regresyon modeli için çok yönlü ANOVA (tüm varsayımları sıfır olmayan eğim parametrelerinin F dağılımı için merkeziyetçi olmayan bir parametre oluşturmak için nasıl bir araya geldiğini bulmak mümkündür , ancak uzaktan sezgisel değildir ve kimseden şüpheliyim yapar)
- W
- Homojenite varyans testinin değeri (ör. Levene testi ; yukarıdakilerle aynı yorumlar)
- Varsayımları kontrol etmek için yapılan diğer testler vb.
- Çalışmada birincil ilgi açıklayıcı değişkeni dışındaki değişkenlerin t-testleri
- ilk / keşif araştırması (örneğin pilot çalışmalar)