Toplanan verileri tekrar tekrar test ederken genel tip I hatası


12

Sıralı grup yöntemleri hakkında bir sorum var .

Wikipedia'ya göre:

İki tedavi grubuyla yapılan randomize bir çalışmada, klasik grup sıralı testi aşağıdaki şekilde kullanılır: Her gruptaki n süjeler mevcutsa, 2n süjeler üzerinde bir ara analiz yapılır. İstatistiksel analiz iki grubu karşılaştırmak için yapılır ve alternatif hipotez kabul edilirse deneme sonlandırılır. Aksi takdirde, deneme, grup başına n denek olmak üzere 2n denek için devam eder. İstatistiksel analiz 4n denek üzerinde tekrar yapılır. Alternatif kabul edilirse, deneme sona erer. Aksi takdirde, 2n denekten oluşan N set mevcut olana kadar periyodik değerlendirmelerle devam eder. Bu noktada, son istatistiksel test yapılır ve deneme durdurulur

Ancak bu şekilde biriken verileri tekrar tekrar test ederek, tip I hata seviyesi şişirilir ...

Numuneler, bir diğerinden genel tip I hata bağımsız olsaydı, olurduα

α=1(1α)k

burada her testin seviyesidir ve ara görünüşlerin sayısıdır.kαk

Ancak üst üste geldiklerinden örnekler bağımsız değildir. Ara analizlerin eşit bilgi artışlarıyla yapıldığı varsayılarak , (slayt 6)

resim açıklamasını buraya girin

Bana bu tablonun nasıl elde edildiğini açıklayabilir misiniz?

Yanıtlar:


12

Aşağıdaki slaytlar, 14 ile 14 arasındaki fikri açıklar. Dikkatinizi çeken nokta, istatistik dizisinin ilişkili olduğudur.

Bağlam, bilinen standart sapmaya sahip bir z-testidir. İlk test istatistiği , uygun şekilde standartlaştırılmıştır, ile Normal (0,1) bir dağılıma sahiptir . İkinci istatistik , ancak - ilki ikinci için kullanılan verilerin bir alt kümesini kullandığından - iki istatistik korelasyon katsayısı ile ilişkilidir . Bu nedenle binormal bir dağılıma sahiptir. Tip I hata olasılığı (sıfır hipotezi altında) ya (a) birinci testte tip I hata oluşması ya da (b) birinci testte tip I hata oluşmamasına, ancak ikinci test. Let Φ z 2 z1Φz2 (z1,z2)C=Φ - 1 (1-0.05 ila/2)a| z1| >c| z1| c| z2| >c1/2(z1,z2)c=Φ1(10.05/2)kritik değer olmalıdır (nominal boyutu = 0,05 olan iki taraflı bir test için ). Sonra iki analiz sonra bir tür I hata şansı veya ve . Sayısal entegrasyon, bu olasılık için tabloya uygun olarak 0.0831178 değerini verir. Tablodaki sonraki değerler benzer akıl yürütme (ve daha karmaşık entegrasyonlar) ile elde edilir.α|z1|>c|z1|c|z2|>c

Bu grafik binormal pdf'i ve entegrasyon bölgesini (katı yüzey) göstermektedir. Binormal PDF, 3D yüzey çizimi


Anladım. Teşekkür ederim! Kor (z1, z2) korelasyonunu elde etmek zor mu?
ocram

@ Marco, Korelasyonun hesaplanması kolaydır, çünkü test istatistiği çok basittir: normal değişkenlerin doğrusal bir kombinasyonudur. (Bunun nedeni, varyansın bilindiğini varsaymamızdır.) Alternatif olarak, ikinci istatistiğin iki bağımsız rastgele değişkenin toplamı olduğunu düşünebilirsiniz: ilki, artı ek veriler tarafından oluşturulan değişiklik, . Daha karmaşık durumlarda, korelasyonun hesaplanması oldukça zor olabilir: sıralı testleri motive etmek için bu biraz idealize edilmiş durumun kullanılmasının bir nedeni budur! z 1 - z 2z1z1-z2
whuber

Çok teşekkür ederim. Evet, korelasyonun hesaplanması oldukça kolay görünüyor. Aslında, bağlamın iki normal dağılımın ortalamalarının bir karşılaştırması olduğu açık değildi. Şimdi, açık ve diğer her şeyi de çok netleştiriyorsunuz! Teşekkür ederim!
ocram

n = 400 için bunun nasıl hesaplanacağını formül (veya R kodu) verebilir misiniz? Bunu kendim yaparım ama ne yazık ki nasıl bilmiyorum. Birden fazla karşılaştırmam (örneğin 4 oranın karşılaştırılması) varsa ve Bonferroni gibi bir düzeltme yapmaz ve tekrarlanan testler yaparsam genel hata oranını hesaplamak istiyorsam formülü nasıl ayarlamam gerekir? Bana bu konuda yardım eder misin?
Andreas
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.