Evet ve hayır.
İlk önce "evet"
Gözlemlediğiniz şey, bir test ve bir güven aralığı aynı istatistiği temel aldığında, aralarında bir denklik olduğu: değerini , parametrenin null değerinin olduğu en küçük değeri olarak yorumlayabiliriz. dahil olacak güven aralığı.α 1 - αpα1−α
Let parametre alanı içinde bilinmeyen bir parametre olarak ve örnek izin , rasgele değişkeni gerçekleştirir . Basitlik için, güven aralığı , rastgele bir aralık olarak rastgele bir aralık olarak tanımlayın , böylece kapsam olasılığı
(Benzer şekilde, kapsama olasılığının ya da ile sınırlandırıldığı genel kapsamları da düşünebilirsiniz . Akıl yürütme benzerdir.)İçeride ISTV melerin RWMAIWi'nin ⊆ R x = ( x 1 , ... , x , n ) ∈ X , n ⊆ R , n X = ( X 1 , ... , x , n ) bir α ( X ) P θ ( θ ∈ I α ( x ) ) = 1 - αθΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX =( X1, … , Xn)benα( X )
1 - α
Pθ( θ ∈ Benα( X ) ) = 1 - αTüm α∈(0,1) için.
1 - α
nokta boş hipotezinin iki taraflı bir sınamasını düşünün , alternatif . Let testinin p-değeri belirtir. Herhangi biri için , düzeyinde reddedilen durumunda . Düzeyi ret bölgesi kümesidir reddedilmesine neden :
H 1 ( θ 0'H0( θ0) : θ = θ0 λ ( θ 0 , x ) α ∈ ( 0 , 1 ) H 0 ( θ 0 ) α λ ( θ 0 , x ) ≤ α α x H 0 ( θ 0 ) R'H1( θ0) : θ ≠ θ0λ ( θ0, x )α ∈ ( 0 , 1 )'H0( θ0)αλ ( θ0, x ) ≤ αα x'H0( θ0)
R,α( θ0) = { x ∈ Rn: λ ( θ0, x ) ≤ α } .
Şimdi, için p-değerleri olan iki taraflı sınamalar ailesini düşünün . Böyle bir aile için ters çevrilmiş bir reddetme bölgesi tanımlayabilirizθ ∈ Θ Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ ( θ , x )θ ∈ Θ
Sα( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .
Herhangi bir sabit , , eğer da reddedilirse, eğer ise ve eğer sadece eğer , yani,
Test, tamamen belirtilen tamamen boş null dağılımlı bir test istatistiğine altında . Sonra
Bu denklem herhangi birlH 0 ( θ 0 ) x ∈ R ) P θ 0 ( x ∈ R α ( ) ) , Q α ( x ) θ 0 α Sθ0'H0( θ0)θ 0 ∈ Q α ( x ) x ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) . λ ( θ 0 , X ) ∼ U ( 0 , 1 ) H 0 ( θ 0)x ∈ Rα( θ0)θ0∈ Qα( x )
x ∈ Rα( θ0) ⇔ İçeride ISTV melerin RWMAIWi'nin0∈ Qα( x ) .
λ ( θ0, X ) ∼ U ( 0 , 1 )'H0( θ0)Pθ0( X ∈ Rα( θ0) ) = Pθ0( λ ( θ0, X ) ≤ α ) = a .
θ0∈ Θve yukarıdaki denklemden beri, rasgele ayarının her zaman olasılık olan parametresini her zaman kapsar . Sonuç olarak, izin tamamlayıcısını ifade için, her Elimizdeki
yani ters çevrilen reddetme bölgesinin tamamlayıcısının için güven aralığı olduğu anlamına gelir .
Pθ0( X ∈ Rα( θ0) ) = Pθ0( θ0∈ Qα( X ) ) ,
Sα( x )θ0αSCα(x )Sα( x )θ0∈ ΘPθ0( θ0∈QCα( X ) ) = 1 - α ,
1 - αθ
Farklı null araçları ve farklı numune araçları , için normal bir ortalama için testine karşılık gelen reddetme bölgelerini ve güven aralıklarını gösteren bir çizim verilmiştir . Gölgeli açık gri bölgede ise reddedilir . Koyu gri renkte gösterilen, reddetme bölgesi ve güven aralığı .
θ ˉ x σ = 1 H 0 ( θ )zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Bunun çoğu doktora tezimden alınmıştır .)
Şimdi "hayır" için
Yukarıda güven aralıklarını oluşturmanın standart yolunu açıkladım. Bu yaklaşımda, aralığı oluşturmak için bilinmeyen parametre ile ilgili bazı istatistikler kullanıyoruz . değerindeki aralık koşulunun uzunluğunu en aza indirmeyi amaçlayan en aza indirme algoritmalarına dayalı aralıklar da vardır . Genellikle, bu aralıklar bir teste karşılık gelmez.θX
Bu fenomen, iç içe geçmeyen bu tür aralıklarla ilgili problemlerle ilgilidir, bu da% 94 aralığının% 95 aralığından daha kısa olabileceği anlamına gelir. Bununla ilgili daha fazla bilgi için, bu son makalemin 2.5. Bölümüne bakın (Bernoulli'de görünmek üzere).
Ve ikinci bir "hayır"
Bazı problemlerde, standart güven aralığı, standart test ile aynı istatistiklere dayanmamaktadır ( bu yazıda Michael Fay tarafından tartışıldığı gibi ). Bu durumlarda, güven aralıkları ve testler aynı sonuçları vermeyebilir. Örneğin, , güven aralığında 0 olmasına rağmen, test tarafından reddedilebilir. Farklı istatistikler kullanıldığından, bu yukarıdaki "evet" ile çelişmez.θ0=0
Ve bazen "evet" iyi bir şey değil
Bir yorumda f harfinin işaret ettiği gibi , bazen aralıklarla testlerin birbiriyle çelişen hedefleri vardır. Kısa aralıklarla yüksek güce sahip testler istiyoruz, ancak en kısa aralık her zaman en yüksek güce sahip teste karşılık gelmiyor. Bu bazı örnekler için bakınız bu kağıdı (çok değişkenli normal dağılım) veya bu (üstel dağılım) veya Bölüm 4 tezim .
Bayesliler ayrıca hem evet hem hayır diyebilirler.
Birkaç yıl önce, burada Bayesian istatistiklerinde de bir test-aralık-denklik olup olmadığına dair bir soru yayınladım . Kısa cevap, standart Bayesian hipotez testini kullanarak cevabın "hayır" olmasıdır. Test problemini bir miktar yeniden düzenleyerek cevap, ancak "evet" olabilir. (Kendi soruma cevap verme girişimlerim sonunda bir bildiri haline geldi !)