Herhangi birinin p-değerlerinin, anlamlılık seviyesinin ve tip I hatasının tanımları ve kullanımlarıyla ilgili kısa bir özet verip veremeyeceğini merak ediyordum.
P-değerlerinin "en azından gerçekten gözlediğimiz en yüksek düzeyde bir test istatistiği elde etme olasılığı" olarak tanımlandığını, bir anlamlılık seviyesinin ise p-değeri önemli olup olmadığını ölçmek için rastgele bir kesim değeri olduğunu anlıyorum. . Tip I hata, reddedilen doğru bir boş hipotezi reddetme hatasıdır. Ancak, anlamlılık düzeyi ile tip I hatası arasındaki fark konusunda emin değilim, aynı kavram değil mi?
Örneğin, 1000 kere bir madeni para çevirdiğim ve 'kafalara' inme sayısını sayan çok basit bir deney yapalım. Boş hipotezim H0, kafaların = 500 (tarafsız para) olduğu yönünde. Daha sonra önem seviyemi alpha = 0.05 olarak belirledim.
Bozuk parayı 1000 kere çeviriyorum ve sonra p-değerini hesaplıyorum, eğer p-değeri> 0.05 ise boş hipotezi reddedemem ve p-değeri <0.05 ise boş hipotezi reddediyorum.
Şimdi, bu deneyi tekrar tekrar yaparsam, her seferinde p değerini hesaplar ve ya boş hipotezi reddeder ya da reddeder ya da reddeder / reddedememeyi saymazsam, o zaman boş hipotezlerin% 5'ini reddederdim. gerçekte hangileri doğruydu, doğru mu? Bu tip I hatanın tanımıdır. Bu nedenle, Fisher önem testindeki önem düzeyi, eğer tekrarlanan deneyler yaparsanız, temel olarak Neyman-Pearson hipotez testindeki tip I hatasıdır.
Şimdi p-değerlerine gelince, son denememden 0.06'lık bir p-değeri almış olsaydım ve çok sayıda denemeler yapıp, 0'dan 0.06'ya kadar bir p-değeri aldığımı saysam, o zaman Gerçek bir boş hipotezi reddetme şansı% 6?