Sahip olduğunuz çok sınırlı bilgi kesinlikle ciddi bir kısıtlamadır! Ancak işler tamamen umutsuz değil.
Aynı ismin uyum iyiliği testinin test istatistiği için asimptotik dağılımına yol açan aynı varsayımlar altında, alternatif hipotez altındaki test istatistiği, asemptotik olarak, merkezi olmayan bir dağılımına sahiptir. İki uyaranın a) anlamlı olduğunu ve b) aynı etkiye sahip olduğunu varsayarsak, ilişkili test istatistikleri aynı asimtotik noncentral dağılımına sahip olacaktır. Bunu bir test oluşturmak için kullanabiliriz - temel olarak, merkez dışılık parametresi lambda'yı tahmin ederek ve test istatistiklerinin merkez dışı dağılımının kuyruklarında olup olmadığını görerek kullanabiliriz . (Bu testin çok fazla güce sahip olacağı anlamına gelmez.)χ 2 χ 2 λ χ 2 ( 18 , λ )χ2χ2χ2λχ2( 18 , λ^)
İki test istatistiği verilen ortalamasızlık parametresini ortalamasını alarak ve serbestlik derecelerini (moment tahmincisi yöntemi) çıkararak, 44 tahmini vererek veya maksimum olasılıkla tahmin edebiliriz:
x <- c(45, 79)
n <- 18
ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619
İki tahminimiz arasında iyi bir anlaşma, iki veri noktası ve 18 serbestlik derecesi göz önüne alındığında aslında şaşırtıcı değil. Şimdi bir p değeri hesaplamak için:
> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421
Bu yüzden p-değerimiz 0.12, iki uyaranın aynı olduğuna dair sıfır hipotezini reddetmek için yeterli değil.
Bu test, merkez dışılık parametreleri aynı olduğunda (kabaca)% 5 ret oranına sahip mi? Herhangi bir gücü var mı? Bu soruları aşağıdaki gibi bir güç eğrisi oluşturarak cevaplamaya çalışacağız. İlk olarak, ortalama lambda'yı tahmini 43,68 değerine sabitleriz. İki test istatistiği için alternatif dağılımlar için 18 serbestlik derecesi ve merkezsizlik parametreleri ile merkezi olmayan olacaktır . Her bir için bu iki dağıtımdan 10000 çekilişi simüle edeceğiz ve testimizin% 90 ve% 95 güven düzeyinde ne sıklıkta reddettiğini göreceğiz.χ 2 ( λ - δ , λ + δ ) δ = 1 , 2 , … , 15 δλχ2(λ−δ,λ+δ)δ=1,2,…,15δ
nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
for (i in 1:10000)
{
x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
pval <- pchisq(min(x), n, lhat)
nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
}
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000
plot(preject05~delta, type='l', lty=1, lwd=2,
ylim = c(0, 0.4),
xlab = "1/2 difference between NCPs",
ylab = "Simulated rejection rates",
main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
expression(paste(alpha, " = 0.10"))),
lty=c(1,2), lwd=2)
ki aşağıdakileri verir:
Gerçek null hipotez noktalarına (x ekseni değeri = 0) baktığımızda, testin tutucu olduğunu görüyoruz, çünkü seviyenin gösterdiği sıklıkta reddetmediği, ancak ezici bir şekilde değil. Beklediğimiz gibi, çok fazla gücü yok, ama hiçbir şeyden daha iyi. Mümkün olan çok sınırlı miktarda bilgi göz önüne alındığında, orada daha iyi testler olup olmadığını merak ediyorum.