Evet, çok çeşitli pratik ortamlarda güven aralığı karşılaştırmaları ve hipotez testleri arasında bazı basit ilişkiler vardır. Bununla birlikte, CI prosedürlerinin ve t-testinin doğrulanmasının yanı sıra verilerimiz için uygun olduğunu, örnek boyutlarının çok farklı olmadığını ve iki setin de benzer standart sapmalara sahip olduğunu kontrol etmeliyiz. Ayrıca, iki güven aralığını karşılaştırmaktan son derece hassas p değerleri elde etmeye çalışmamalı, ancak etkili yaklaşımlar geliştirmekten memnuniyet duymalıyız.
Önceden verilen iki yanıtı uzlaştırmaya çalışırken (@John ve @Brett tarafından) matematiksel olarak açık olmasına yardımcı olur. Bu sorunun ayarlanması için uygun simetrik iki taraflı güven aralığı için bir formül
CI = m ± tα( n ) sn--√
burada m , n bağımsız gözlemlerin örnek ortalamasıdır , s , örnek standart sapmadır, 2 α , istenen test büyüklüğüdür (maksimum yanlış pozitif oran) ve tα( n ) , Öğrenci t dağılımının üst 1−α yüzdelik değeridir. ile n−1 serbestlik derecesi. (Geleneksel gösterimdeki bu küçük sapma, n - n−1 ayrımı üzerinde herhangi bir sıkıntı yaratmaya gerek kalmayarak herhangi bir şekilde önemsiz hale gelmesini önleyerek, gösterimi kolaylaştırır .)
Alt simgeler kullanılarak 1 ve 2 ile karşılaştırma için veri oluşan bağımsız iki takımın ayırt 1 , iki ortalama büyük tekabül eden bir sigara güven aralıkları -overlap eşitsizlik (düşük güven sınırı 1) ile ifade edilir > (üst güven sınırı 2 ); yani. ,
m1- tα( n1) s1n1--√> m2+ tα( n2) s2n2--√.
Bu, basit cebirsel manipülasyonlarla karşılık gelen hipotez testinin (iki aracı karşılaştırmak için) t-istatistiği gibi görünmek suretiyle yapılabilir.
m1- m2s21/ n1+ s22/ n2-----------√> s1n2--√tα( n1) + s2n1--√tα( n2)n1s22+ n2s21---------√.
Sol taraf, hipotez testinde kullanılan istatistiktir; genellikle n1+ n2 serbestlik derecesine sahip bir Student t dağılımının yüzdelik bir yüzdesiyle karşılaştırılır : yani, tα( n1+ n2) . Sağ taraf, orijinal t dağılım yüzdeliklerinin yanlı ağırlıklı bir ortalamasıdır.
Şimdiye kadar yapılan analiz cevabı @Brett'in haklı çıkardı: basit bir ilişki olmadığı görülüyor. Ancak, daha ileri araştıralım. Öyle çünkü yapmak için ilham alıyorum, sezgisel, güven aralıkları olmayan bir örtüşme gerektiğini şeyler söylemek!
Öncelikle, hipotez testinin bu biçiminin yalnızca s1 ve s2 en az yaklaşık olarak eşit olmasını beklediğimizde geçerli olduğuna dikkat edin . (Aksi takdirde azılı yüz Behrens-Fisher problemi ve karmaşıklığını.) Yaklaşık eşitliği kontrol üzerine sben , o zaman formda yaklaşık bir basitleştirme oluşturabilir
m1- m2s 1 / n1+ 1 / n2----------√> n2--√tα( n1) + n1--√tα( n2)n1+ n2------√.
Burada, s ≈ s1≈ s2 . Gerçekçi olarak, güven sınırlarının bu resmi olmayan karşılaştırmasının α aynı boyda olmasını beklememeliyiz . Bizim soru sonra olup olmadığıdır α' sağ taraftaki (en azından yaklaşık olarak) olacak şekilde doğru t istatistiğine eşittir. Yani ne için α' harf olmasıdır
tα'( n1+ n2) = n2--√tα( n1) + n1--√tα( n2)n1+ n2------√?
Eşit örneklem büyüklükleri için α ve α' bir güç yasası ile birbirine bağlandığı (oldukça yüksek doğrulukta) ortaya çıktı. Örneğin, burada durumlar için ikisinin bir log-log grafiğidir n1= n2= 2 (en düşük mavi çizgi), n1= n2= 5 (orta kırmızı çizgi), n1= n2= ∞ ( en yüksek altın çizgi). Ortadaki yeşil kesik çizgi aşağıda açıklanan bir yaklaşımdır. Bu eğrilerin düzlüğü bir güç yasasına inanır. N = n 1 ile değişirn = n1= n2 , ama çok.
Cevap, { n1, n2} setine bağlıdır , ancak örnek boyutlarındaki değişikliklerle gerçekte ne kadar değiştiğini merak etmek doğaldır. Özellikle, orta ila büyük örneklem büyüklükleri için (belki n1≥ 10 , n2≥ 10 veya bunun gibi) numune büyüklüğünün çok az fark yaratacağını ümit edebiliriz . Bu durumda, α ′ ile α arasındaki ilişkiyi belirlemek için nicel bir yol geliştirebiliriz .α'α
Bu yaklaşım, örnek boyutlarının birbirinden çok farklı olmaması şartıyla işe yarar. Basitlik ruhunda , güven aralığı büyüklüğü α'ya karşılık gelen test büyüklüğü α' nın hesaplanması için bir omnibus formülü bildireceğim . Buα
α'≈ e α1.91;
yani,
α'≈ exp( 1 + 1,91 günlüğü( a ) ) .
Bu formül bu yaygın durumlarda oldukça iyi çalışır:
n1= n2= 2n1= n2= 5n1= n2= ∞α
Bu, bir sürü güven aralığı göz küresi için fazlasıyla yeterli.
2 α2 e α1.91
2 α
2 α 2 α'
0.05 0.005
0,01 0,0002
0.005 0.00006
2 α = 0,05p < .005n0,0037n = 20,0056n = ∞
Bu sonuç, @John tarafından verilen cevabı haklı çıkarır (ve umarım bunu iyileştirir). Bu nedenle, önceki cevaplar çatışma içinde gibi görünmekle birlikte, her ikisi de (kendi yöntemleriyle) doğrudur.