Benim bakış açımdan, bu konu bir önem testi yapmanın gerçekte ne anlama geldiğine bağlı. Anlamlılık testi ya sıfır hipotezini reddetme ya da reddetmeme kararı verme aracı olarak tasarlanmıştır. Fisher bu (keyfi) kararı vermek için meşhur 0.05 kuralını getirdi.
Temel olarak, anlamlılık testi mantığı, kullanıcının veri toplamadan önce sıfır hipotezini (geleneksel olarak 0.05) reddetmek için bir alfa seviyesi belirtmesi gerektiğidir . Anlamlılık testini tamamladıktan sonra, p değeri alfa seviyesinden küçükse (veya başka türlü reddetmezse) kullanıcı null değerini reddeder.
Bir etkiyi son derece anlamlı (örneğin 0.001 düzeyinde) olarak ilan edememenizin nedeni, bulmaya hazır olduğunuzdan daha güçlü kanıt bulamamanızdır. Bu nedenle, alfa seviyenizi testten önce 0,05 olarak ayarlarsanız, p değerlerinizin ne kadar küçük olduğuna bakılmaksızın yalnızca 0,05 düzeyinde kanıt bulabilirsiniz. Aynı şekilde, "biraz anlamlı" veya "anlamlılığa yaklaşan" etkilerden bahsetmek de pek mantıklı değildir çünkü 0,05 olan bu rastgele kriteri seçtiniz. Anlamlılık testi mantığını tam anlamıyla yorumluyorsanız, 0.05'ten büyük herhangi bir şey önemli değildir.
"Öneme yaklaşma" gibi terimlerin yayınlanma şansını artırmak için sıklıkla kullanıldığını kabul ediyorum. Bununla birlikte, yazarların bunun için suçlanabileceğini düşünmüyorum, çünkü bazı bilimlerdeki mevcut yayın kültürü hala 0.05'in "kutsal kasesine" dayanmaktadır.
Bu konuların bazıları şu konularda tartışılmaktadır:
Gigerenzer, G. (2004). Akılsız istatistikler. Sosyo-Ekonomi Dergisi, 33 (5), 587-606.
Royall, R. (1997). İstatistiksel kanıt: bir olasılık paradigması (Cilt 71). CRC tuşuna basın.