Ben okuyordum -değerlerinin, tip 1 hata oranları, anlamlılık düzeyleri güç hesaplamaları, efekt boyutları ve Neyman-Pearson tartışma vs Fisher. Bu beni biraz bunalmış hissetmeme neden oldu. Metin duvarı için özür dilerim, ancak şu anki sorularıma geçmeden önce bu kavramlarla ilgili şu anki anlayışımı gözden geçirmenin gerekli olduğunu hissettim.
Topladığım şeye göre, bir değeri basit bir sürpriz ölçüsüdür, sıfır hipotezinin doğru olduğu göz önüne alındığında, en azından en uç düzeyde bir sonuç alma olasılığı. Fisher başlangıçta sürekli bir ölçü olması için tasarlandı.
Neyman-Pearson çerçevesinde, önceden bir önem seviyesi seçer ve bunu (keyfi) bir kesme noktası olarak kullanırsınız. Anlamlılık seviyesi, tip 1 hata oranına eşittir. Uzun çalışma frekansı ile tanımlanır, yani bir deneyi 1000 kez tekrarlarsanız ve boş hipotez doğruysa, bu denemelerin yaklaşık 50'si örneklem değişkenliği nedeniyle önemli bir etkiye neden olur. Bir anlamlılık düzeyi seçerek, kendimizi bu yanlış pozitiflere karşı kesin bir olasılıkla koruyoruz. değerleri geleneksel olarak bu çerçevede görünmez.
Biz bulursanız 0,01 değeri, bu mu değil tip 1 hata oranı 0.01 olduğu anlamına, tip 1 hata önsel belirtilmektedir. Bunun Fisher ve NP tartışmalarındaki ana argümanlardan biri olduğuna inanıyorum, çünkü değerleri genellikle 0,05 *, 0,01 **, 0,001 *** olarak bildiriliyor. Bu etki belli anlamlı olduğunu söyleyerek insanları yanlış yönlendirebilir yerine belirli bir önemi değerde arasında-değeri.
Ayrıca değerinin örneklem büyüklüğünün bir işlevi olduğunu da fark ettim . Bu nedenle mutlak bir ölçüm olarak kullanılamaz. Küçük bir değeri büyük bir örnek deneyinde küçük, alakalı olmayan bir etkiye işaret edebilir. Buna karşı koymak için, denemeniz için örnek boyutunu belirlerken güç / etki büyüklüğü hesaplaması yapmak önemlidir. değerleri bize bir etkisinin olup olmadığını söyler, ne kadar büyük olduğunu değil. Sullivan 2012'ye bakınız .
Sorum şu: değerinin bir sürpriz ölçüsü olduğu (daha küçük = daha ikna edici) olduğu gerçeğini nasıl uzlaştırıp aynı zamanda mutlak bir ölçüm olarak görülemez?
Aşağıdaki Ne hakkında karıştı şöyledir: biz küçük bir daha emin olabilir büyük olandan-değeri? Balıkçı anlamında, evet derdim, daha şaşırdık. NP çerçevesinde, daha küçük bir önem seviyesi seçmek, kendimizi yanlış pozitiflere karşı daha güçlü bir şekilde koruduğumuz anlamına gelir.
Ancak diğer taraftan, değerleri örneklem büyüklüğüne bağlıdır. Mutlak bir ölçü değiller. Dolayısıyla 0.001593'ün 0.0439'dan daha önemli olduğunu söyleyemeyiz. Yine de, Fisher'ın çerçevesi içinde ima edilecek olan şey: bu kadar aşırı bir değere daha çok şaşırırız. Bir yanlış isim olma terimiyle ilgili çok önemli bir terim bile var : Sonuçları "çok önemli" olarak adlandırmak yanlış mı?
Bazı bilim alanlarındaki değerlerinin yalnızca 0.0001'den küçük olduklarında önemli olarak kabul edildiğini duydum , oysaki diğer alanlarda 0.01 değerinin çok önemli olduğu kabul edildi.
İlgili sorular:
Neden düşük p değerleri boşa karşı daha fazla kanıt değil? Johansson 2011'den bağımsız değişkenler (@amoeba tarafından sağlandığı gibi)