Yorumlarınız nedeniyle iki ayrı bölüm yapacağım:
p-değerleri
İstatistiksel hipotez testinde alternatif hipotez için 'istatistiksel kanıt' bulabilirsiniz ; Ben de açıklandığı üzere aşağıdaki Ne hipotezini reddetmek için başarısız olur? , matematikte 'çelişkili kanıt' ile benzerdir.
Biz 'istatistiksel kanıt' bulmak istiyorum Yani eğer o zaman biz göstermek tersini farz biz diyoruz ispat çalıştığı şey , H 1 . Bundan sonra bir örnek çizeriz ve örnekten test istatistiği (örn. Bir t testinde t değeri) hesaplarız.H0H1
Daha sonra, nin doğru olduğunu ve numunemizin H 0 altındaki dağılımdan rastgele çekildiğini varsaydığımız için, (rastgele) örneğimizden elde edilen değeri aşan veya ona eşit olan değerleri gözlemleme olasılığını hesaplayabiliriz . Bu olasılığa p değeri denir.H0H0
Bu değer, biz bu seçtiğim Thase anlamlılık düzeyinde daha küçük '' küçük yeterince '' yani ise, o reddetme ve biz düşünün H 1 'istatistiksel olarak kanıtlanmış' dir.H0H1
Bu şekilde birkaç şey önemlidir:
- olasılıkları doğru olduğu varsayılarak türettikH0
- H 0 altında varsayılan dağılımdan rastgele bir örnek aldıkH0
- Biz karar Bulunan kanıt için rastgele örnekten elde edilen test istatistik aşılması düşük bir olasılık sahipse. Bu nedenle, H 0 doğru olduğunda aşılması imkansız değildir ve bu durumlarda tip I hatası yaparız. H1H0
Öyleyse tip I hatası nedir: H 0'dan rastgele alınan örnek, tip 0 hatası, gerçekte doğruyken H 0'ın yanlış olduğu sonucuna götürür .H0H0
Bunun, p-değerinin tip I hata olasılığı olmadığını ima ettiğini unutmayın . Gerçekten de, tip I hatası test tarafından yanlış bir karardır ve karar sadece p-değerini seçilen önem seviyesi ile karşılaştırarak yapılabilir, tek başına bir p-değeri ile karar veremez , ancak karşılaştırdıktan sonra bir kararın verildiği seçilen önem seviyesine göre p değeri ve hiçbir karar alınmadığı sürece tip I hatası tanımlanmamıştır.
Peki p değeri nedir? Potansiyel olarak yanlış ret dolayı biz altında rastgele bir numune alın gerçeğine olan H 0 o numuneyi çizerek biz '' kötü şans '' olduğunu olabilir böylece, ve bu '' kötü şans '' potansiyel olduğunu H 0'ın yanlış reddine . Yani p değeri (bu tam olarak doğru olmasa da) daha çok `` kötü örnek '' çizme olasılığı gibidir. P-değerinin doğru yorumlanması, test istatistiğinin H 0 altında rastgele çekilmiş bir örnekten türetilen test istatistiği değerini aşması veya buna eşit olması ihtimalidir.H0H0H0H0
Yanlış keşif oranı (FDR)
Şöyle Boş hipotez bir 'istatistik kanıt' olarak kabul etti, reddedilir, yukarıdaki her zaman açıklandığı . Bu yüzden yeni bilimsel bilgiler bulduk, bu yüzden buna keşif denir . Ayrıca, bir tip I hatası yaptığımızda yanlış keşifler yapabileceğimiz (yani H 0'ı yanlış reddetme ) yapabileceğimiz açıklanmaktadır. Bu durumda yanlış bir bilimsel gerçek inancına sahibiz. Sadece gerçekten doğru şeyleri keşfetmek istiyoruz ve bu nedenle yanlış keşifleri minimumda tutmaya çalışıyoruz, yani biri I. tip bir hatayı kontrol edecektir. Tip I hata olasılığının seçilen önem seviyesi α olduğunu görmek o kadar zor değildir . Bu nedenle, tip I hatalarını kontrol etmek için, bir αH1H0αα- '' yanlış kanıt '' kabul etme isteğinizi yansıtıyor.
Sezgisel olarak bu araçlar biz örneklerin çok sayıda çizmek ve her numune ile test ettik gerçekleştirirseniz ki, o zaman bir fraksiyon bu testlerin yanlış bir sonuca yol açacaktır. 'Birçok örnek üzerinde ortalama' olduğumuzu belirtmek önemlidir ; bu yüzden aynı test, birçok örnek. α
Aynı numuneyi birçok farklı test yapmak için kullanırsak, birden fazla test hatası alırız ( Family-wise error sınırındaki yanıtım bölümüne bakın : Farklı bağımsız soru çalışmalarında veri setlerinin yeniden kullanılması birden fazla test problemine yol açar mı? ). Bu durumda, enflasyonu , örneğin bir Bonferroni düzeltmesi gibi , ailenin hata oranını (FWER) kontrol etme tekniklerini kullanarak kontrol edebilir .α
FWER'den farklı bir yaklaşım, yanlış keşif oranını (FDR) kontrol etmektir . Bu durumda, tüm keşifler (D) arasındaki yanlış keşiflerin (FD) sayısı kontrol edilir, böylece biri , D reddedilenH0sayısıdır.FDDH0
Bu nedenle tip I hata olasılığı , aynı testi birçok farklı örnek üzerinde yapmakla ilgilidir. Çok sayıda örnek için, tip I hata olasılığı, yanlış bir reddetmeye yol açan örnek sayısına yakınsayacaktır ve çekilen toplam örnek sayısına bölünecektir .
FDR aynı numune üzerinde ve edecek testlerin çok sayıda için birçok testler ile ilgisi var tip I hatası yapıldığı testlerin sayısına yakınsama (yani sahte keşifler sayısı) toplam sayıya ait red sayısını bölünmüş (yani toplam keşif sayısı)H0 .
Yukarıdaki iki paragrafı karşılaştırarak şunu unutmayın:
- Bağlam farklıdır; bir test ve birçok numune karşısında birçok test ve bir numune.
- Tip I hata olasılığını hesaplamak için payda, FDR'yi hesaplamak için paydadan açıkça farklıdır. Paylar bir şekilde benzerdir, ancak farklı bir bağlama sahiptir.
FDR, aynı örnek üzerinde birçok test gerçekleştirirseniz ve 1000 keşif (yani reddi ) bulursanız, 0,38 FDR ile 0,38 × 1000 yanlış keşif yapacağınızı söyler .H00.38×1000
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is true
P - değeri apriori tip I hatası yapma olasılığını, yani doğru olduğu varsayımı altında sıfır hipotezini reddetme olasılığını temsil eder.