analiz
Bu kavramsal bir soru olduğundan, basitlik için güven aralığının ortalama yapıda olmasıdır kullanılarak gelişigüzel bir örnek, büyüklüğü ve bir ikinci rasgele numune büyüklüğü alınır aynı Normal arasından, dağıtım. (Sizin gibi değiştirebilir durumunda Öğrenci gelen değerlere göre ler dağılımı serbestlik derecesi, aşağıdaki analiz değişmez.)[ ˉ x ( 1 ) + Z α / 2 s ( 1 ) / √1−αμx(1)nx(2)m(μ,σ2)Ztn-1
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1)nx(2)m(μ,σ2)Ztn−1
İkinci örneğin ortalamasının birincisi tarafından belirlenen CI içinde olma şansı
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
İlk örnek ortalaması ilk örnek standart sapması den bağımsız olduğu için (bu normallik gerektirir) ve ikinci örnek birinciden bağımsız olduğundan, örnek U'daki fark bağımsızdır . Ayrıca, bu simetrik aralık için . Bu nedenle, rastgele değişken için yazma ve her iki eşitsizliği kareleme, söz konusu olasılık aynıx¯(1)s(1)U=x¯(2)−x¯(1)s(1)Zα/2=−Z1−α/2Ss(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
Beklenti yasaları, ortalaması ve varyansı anlamına gelirU0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
Yana normal değişkenlerin doğrusal bir kombinasyonudur, bu da normal bir dağılıma sahiptir. Bu nedenle, olduğu kez değişken. Biz zaten biliyorduk olduğu kere değişken. Sonuç olarak, , dağılımına sahip bir değişkenin katıdır . Gerekli olasılık F dağılımı tarafından şu şekilde verilir:UU2σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)
F1,n−1(Z21−α/21+n/m).(1)
Tartışma
İlginç bir durum, ikinci örneğin birinciyle aynı boyutta olması, böylece ve sadece ve olasılığı belirler. İşte için karşı çizilen değerleri .n/m=1nα(1)αn=2,5,20,50
Grafikleri, her bir sınır değere yükselir olarak artar. Geleneksel test boyutu dikey gri bir çizgi ile işaretlenmiştir. değerleri için için sınırlama şansı yaklaşık .αnα=0.05n=mα=0.0585%
Bu sınırı anlayarak, küçük örneklem boyutlarının ayrıntılarını gözden geçireceğiz ve konunun temelini daha iyi anlayacağız. Olarak büyürse, dağılımı yaklaşımlar dağıtım. Standart Normal dağılım , olasılık yaklaşık olarakn=mFχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
Örneğin, , ve . Sonuç olarak, arttıkça eğrilerin ulaştığı sınırlayıcı değer . için neredeyse ulaşıldığını görebilirsiniz (şansın olduğu yerde ).α=0.05Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
Küçük İçin , ilişkisi ve tamamlayıcı olasılık - CI getirmeme riskini değil , ikinci ortalama kapak - neredeyse mükemmel bir güç yasasıdır. αα Bunu ifade etmenin başka bir yolu da log tamamlayıcı olasılığının fonksiyonunun neredeyse doğrusal bir fonksiyonudur . Sınırlayıcı ilişki yaklaşık olaraklogα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
Büyük diğer bir deyişle, ve geleneksel değere yakın bir yerde , yakın olacakn=mα0.05(1)
1−0.166(20α)0.557.
(Bu bana /stats//a/18259/919 adresinde yayınladığım örtüşen güven aralıklarının analizini hatırlatıyor . Gerçekten de, oradaki sihirli güç, , neredeyse sihirli gücün karşılıklı Bu noktada , . Bu noktada, bu analizi, deneylerin tekrarlanabilirliği açısından yeniden yorumlayabilmelisiniz.)1.910.557
Deneysel sonuçlar
Bu sonuçlar basit bir simülasyonla doğrulanır. Aşağıdaki R
kod, kapsama sıklığını, ile hesaplanan şansı ve ne kadar farklı olduklarını değerlendirmek için bir Z skoru döndürür . Z skorları, tipik olarak daha az olan bağımsız olarak, boyut olarak (ya da hatta olup ya da , formül doğruluğunu gösteren Cl hesaplanır), .(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))