Güven aralığı ile t testi için istatistiksel hipotezi test etme arasındaki ilişki


31

Güven aralıklarının ve istatistiksel hipotezi test etmenin güçlü bir şekilde ilişkili olduğu iyi bilinmektedir. Sorularım, sayısal bir değişkene dayalı olarak iki grup için ortalamaların karşılaştırılmasına odaklanmıştır. Bu varsayımın t-testi kullanılarak test edildiğini varsayalım. Diğer taraftan, her iki grup için de güven aralıkları hesaplanabilir. Güven aralıklarının üst üste binmesi ile eşit olan boş hipotezin reddedilmesi (farklı anlamına gelen alternatif lehine - iki taraflı test) arasında bir ilişki var mı? Örneğin, bir test, güven aralıkları ile örtüşmüyorsa boş hipotezi reddedebilir.

Yanıtlar:


31

Evet, çok çeşitli pratik ortamlarda güven aralığı karşılaştırmaları ve hipotez testleri arasında bazı basit ilişkiler vardır. Bununla birlikte, CI prosedürlerinin ve t-testinin doğrulanmasının yanı sıra verilerimiz için uygun olduğunu, örnek boyutlarının çok farklı olmadığını ve iki setin de benzer standart sapmalara sahip olduğunu kontrol etmeliyiz. Ayrıca, iki güven aralığını karşılaştırmaktan son derece hassas p değerleri elde etmeye çalışmamalı, ancak etkili yaklaşımlar geliştirmekten memnuniyet duymalıyız.

Önceden verilen iki yanıtı uzlaştırmaya çalışırken (@John ve @Brett tarafından) matematiksel olarak açık olmasına yardımcı olur. Bu sorunun ayarlanması için uygun simetrik iki taraflı güven aralığı için bir formül

CI=m±tα(n)sn

burada m , n bağımsız gözlemlerin örnek ortalamasıdır , s , örnek standart sapmadır, 2α , istenen test büyüklüğüdür (maksimum yanlış pozitif oran) ve tα(n) , Öğrenci t dağılımının üst 1-α yüzdelik değeridir. ile n-1 serbestlik derecesi. (Geleneksel gösterimdeki bu küçük sapma, n - n-1 ayrımı üzerinde herhangi bir sıkıntı yaratmaya gerek kalmayarak herhangi bir şekilde önemsiz hale gelmesini önleyerek, gösterimi kolaylaştırır .)

Alt simgeler kullanılarak 1 ve 2 ile karşılaştırma için veri oluşan bağımsız iki takımın ayırt 1 , iki ortalama büyük tekabül eden bir sigara güven aralıkları -overlap eşitsizlik (düşük güven sınırı 1) ile ifade edilir > (üst güven sınırı 2 ); yani. ,

m1-tα(n1)s1n1>m2+tα(n2)s2n2.

Bu, basit cebirsel manipülasyonlarla karşılık gelen hipotez testinin (iki aracı karşılaştırmak için) t-istatistiği gibi görünmek suretiyle yapılabilir.

m1-m2s12/n1+s22/n2>s1n2tα(n1)+s2n1tα(n2)n1s22+n2s12.

Sol taraf, hipotez testinde kullanılan istatistiktir; genellikle n1+n2 serbestlik derecesine sahip bir Student t dağılımının yüzdelik bir yüzdesiyle karşılaştırılır : yani, tα(n1+n2) . Sağ taraf, orijinal t dağılım yüzdeliklerinin yanlı ağırlıklı bir ortalamasıdır.

Şimdiye kadar yapılan analiz cevabı @Brett'in haklı çıkardı: basit bir ilişki olmadığı görülüyor. Ancak, daha ileri araştıralım. Öyle çünkü yapmak için ilham alıyorum, sezgisel, güven aralıkları olmayan bir örtüşme gerektiğini şeyler söylemek!

Öncelikle, hipotez testinin bu biçiminin yalnızca s1 ve s2 en az yaklaşık olarak eşit olmasını beklediğimizde geçerli olduğuna dikkat edin . (Aksi takdirde azılı yüz Behrens-Fisher problemi ve karmaşıklığını.) Yaklaşık eşitliği kontrol üzerine sben , o zaman formda yaklaşık bir basitleştirme oluşturabilir

m1-m2s1/n1+1/n2>n2tα(n1)+n1tα(n2)n1+n2.

Burada, ss1s2 . Gerçekçi olarak, güven sınırlarının bu resmi olmayan karşılaştırmasının α aynı boyda olmasını beklememeliyiz . Bizim soru sonra olup olmadığıdır α' sağ taraftaki (en azından yaklaşık olarak) olacak şekilde doğru t istatistiğine eşittir. Yani ne için α' harf olmasıdır

tα'(n1+n2)=n2tα(n1)+n1tα(n2)n1+n2?

Eşit örneklem büyüklükleri için α ve α' bir güç yasası ile birbirine bağlandığı (oldukça yüksek doğrulukta) ortaya çıktı. Örneğin, burada durumlar için ikisinin bir log-log grafiğidir n1=n2=2 (en düşük mavi çizgi), n1=n2=5 (orta kırmızı çizgi), n1=n2= ( en yüksek altın çizgi). Ortadaki yeşil kesik çizgi aşağıda açıklanan bir yaklaşımdır. Bu eğrilerin düzlüğü bir güç yasasına inanır. N = n 1 ile değişirn=n1=n2 , ama çok.

Arsa 1

Cevap, {n1,n2} setine bağlıdır , ancak örnek boyutlarındaki değişikliklerle gerçekte ne kadar değiştiğini merak etmek doğaldır. Özellikle, orta ila büyük örneklem büyüklükleri için (belki n110,n210 veya bunun gibi) numune büyüklüğünün çok az fark yaratacağını ümit edebiliriz . Bu durumda, α ile α arasındaki ilişkiyi belirlemek için nicel bir yol geliştirebiliriz .α'α

Bu yaklaşım, örnek boyutlarının birbirinden çok farklı olmaması şartıyla işe yarar. Basitlik ruhunda , güven aralığı büyüklüğü α'ya karşılık gelen test büyüklüğü α' nın hesaplanması için bir omnibus formülü bildireceğim . Buα

α'eα1.91;

yani,

α'exp(1+1.91günlük(α)).

Bu formül bu yaygın durumlarda oldukça iyi çalışır:

  • n1n2αα>.001

  • 10α

  • α>.02

n1=n2=2n1=n2=5n1=n2=α

Arsa 2

Bu, bir sürü güven aralığı göz küresi için fazlasıyla yeterli.

2α2eα1.91

2α

2α 2α'

0.05 0.005

0,01 0,0002

0.005 0.00006

2α=.05p<0,005n0,0037n=20,0056n=

Bu sonuç, @John tarafından verilen cevabı haklı çıkarır (ve umarım bunu iyileştirir). Bu nedenle, önceki cevaplar çatışma içinde gibi görünmekle birlikte, her ikisi de (kendi yöntemleriyle) doğrudur.


7

Hayır, en azından basit bir tane değil.

Bununla birlikte, iki araç arasındaki farkın t testi ile iki araç arasındaki farkın güven aralığı arasında kesin bir yazışma vardır.

İki araç arasındaki farkın güven aralığı sıfır içeriyorsa, bu fark için bir t-testi aynı güven seviyesinde boş bırakmaz. Aynı şekilde, güven aralığı 0 içermiyorsa, t testi boş değeri reddeder.

Bu, iki aracın her biri için güven aralıkları arasındaki örtüşme ile aynı değildir.


Şu anda olmasa da çok doğru ayrıntıda gizlidir @John, tarafından cevap doğru evet, işaret edebilir Test p-değerleri CI'lerin çakışmaları ilgilidir. İlişki, t-testin kendisinden daha karmaşık değildir. Bu, birinci satırda belirtildiği şekilde birincil kararınızla çelişen görünüme sahiptir. Bu farkı nasıl çözersiniz?
whuber

Çelişkili olduklarını sanmıyorum. Bazı uyarılar ekleyebilirim. Ancak, genel anlamda, ek varsayımlar ve aralığın sunumu dışındaki değişkenler (varyans, örneklem büyüklüğü) dışındaki parametreler hakkında bilgi olmadan yanıt olduğu gibi durur. Hayır, en azından basit bir tane değil.
Brett

5

Tipik eşit varyans varsayımları altında, evet, bir ilişki var. Çubuklar bir bar * sqrt (2) uzunluğundan daha az çakışırsa, o zaman bir t-testi alfa = 0,05'te önemli ölçüde farklı olacağını bulur. Çubukların uçları ancak zar zor temas ederse, 0.01'de bir fark bulunacaktır. Gruplar için güven aralıkları eşit değilse, genellikle ortalamayı alır ve aynı kuralı uygular.

Alternatif olarak, araçlardan birinin etrafındaki güven aralığı genişliği w ise, iki değer arasındaki en az anlamlı fark w * sqrt (2) 'dir. Bağımsız gruplarda payda t-testi, sqrt (2 * MSE / n) ve CI için faktör, sqrt (MSE / n) olduğunu düşündüğünüzde bu basittir.

(% 95 CI varsayıldı)

Buradaki bağımsız araçlarla ilgili güven aralıklarından çıkarımlar yapma konusunda basit bir makale var . Bu soruya ve sahip olabileceğiniz birçok diğer soruyu cevaplayacaktır.

Cumming, G., ve Finch, S. (2005, March). Göze göre çıkarım: güven aralıkları ve veri resimlerinin nasıl okunacağı. Amerikan Psikoloğu , 60 (2), 170-180.


2
İki grubun da aynı büyüklükte olduğunu varsaymanız gerektiğine inanıyorum.
whuber

kabaca, evet ...
John
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.