Genel olarak, daha fazla veriyle test ettiğiniz parametrelerin tahminini geliştirmeye devam edebilirsiniz. Bir test, yarı keyfi bir önem derecesine ulaştığında veri toplamanın durdurulması, kötü çıkarımlar yapmak için iyi bir yoldur. Analistlerin, işin yapıldığına dair bir işaret olarak önemli bir sonucu yanlış anlayabilecekleri, insanların yorumladıklarına göre, Neyman-Pearson çerçevesinin beklenmeyen sonuçlarından biri olduğuna işaret ediyor. p değerlerini reddetme ya da reddetme başarısızlığına neden olarak reddetme ya da reddetme başarısızlığı olarak . Kritik eşiğin hangi tarafında kalıyorlar.
Sık sık paradigmaya Bayesyen alternatifleri göz önüne alınmadan (umarım bir başkası olacaktır), güven aralıkları, temel bir boş hipotezin reddedilebileceği noktadan çok daha bilgilendirici olmaya devam etmektedir. Daha fazla veri toplamanın yalnızca temel anlamlılık testinizin daha da büyük bir önem kazanmasını sağladığını varsayalım (ve daha önceki anlamlılık bulmanızın yanlış bir pozitif olduğunu ortaya çıkarmayın), bunu gereksiz bulursunuz; Bununla birlikte, bu senaryoda, söz konusu parametre etrafındaki güven aralığınız, ilgilendiğiniz nüfusu tam olarak tanımlayabileceğiniz güven derecesini artırarak küçülmeye devam edecektir.
μ = 0
One Sample t-test
data: rnorm(99)
t = -2.057, df = 98, p-value = 0.04234
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-0.377762241 -0.006780574
sample estimates:
mean of x
-0.1922714
t.test(rnorm(99))
α = 0,05rnorm
set.seed(8);t.test(rnorm(99,1))
μ = [ .69 , 1.12 ]
μ = .8mu=.8
set.seed(8);t.test(rnorm(999,1),mu=.8)
μ = 0μ = .8μ = [ .90 , 1.02 ]μ = .89
'H0: μ = .9set.seed(9);t.test(rnorm(999,1),mu=.9)
Aşamalı olarak daha katı null hipotezleri test etmek ya da daha iyisi, sadece güven aralıklarını küçültmeye odaklanmak ilerlemenin bir yoludur. Tabii ki, boş hipotezi reddeden çoğu çalışma, alternatif hipotezi temel alan diğer çalışmalar için zemin hazırlamaktadır. Örneğin, bir korelasyonun sıfırdan büyük olduğuna dair alternatif bir hipotez test ediyor olsaydım, daha sonraki bir takip çalışmasında arabulucular veya moderatörler için test yapabilirdim ... Orijinal sonucu kopyalayabilirim.
Dikkate alınması gereken diğer bir yaklaşım ise denklik testidir. Bir parametrenin, yalnızca tek bir değerden farklı olarak, belirli bir olası değerler aralığında olduğu sonucuna varmak istiyorsanız, parametrenin konvansiyonel alternatif hipotezinize göre yatmasını isteyip istemediğinizi belirleyebilirsiniz. Birlikte, parametrenin bu aralığın dışında kalma olasılığını temsil eden farklı bir boş hipotez grubuna karşı. Bu son olasılık, yazarken aklınızdakilere en çok benzeyebilir:
Alternatifin doğru olması için "bazı kanıtlarımız" var, ancak bu sonucu çıkaramıyoruz. Gerçekten bu sonucu kesin olarak çıkarmak istersem ...
set.seed(8)
rnorm(99)
rnorm(99,1)-1
μ = .8- .2 ≤ μ ≤ .2
require(equivalence);set.seed(8);tost(rnorm(99),epsilon=.2)
tost
μ = [ - .27 , .09 ]rnorm(999)
μ = [ - 0,09 , 0,01 ]
Hala güven aralığının denklik testi sonucundan daha ilginç olduğunu düşünüyorum. Verilerin popülasyonun ne anlama geldiğini alternatif hipotezden daha belirgin olduğunu gösterir ve alternatif hipotezde belirttiğimden daha küçük bir aralıkta yer aldığından oldukça emin olabileceğimi ileri sürmektedir. Göstermek için, gerçekçi olmayan simülasyon güçlerimi bir kez daha kötüye kullanacağım ve şunu kullanarak "kopyalayacağım" set.seed(7);tost(rnorm(999),epsilon=.09345092)
: tabii ki, p = .002.