Tek kuyruklu ve iki kuyruklu test arasındaki fark nedir?


13

İstatistikler dersim için çalışırken tek kuyruklu ve iki kuyruklu hipotez testleri arasındaki farkı anlamaya çalışıyordum. Özellikle, tek kuyruklu test niçin iki kuyruklu test null değerini reddediyor?

Bir örnek:

tek kuyruklu ve iki kuyruklu hipotez testleri arasındaki fark


Yalnızca belirli bir önem düzeyinde reddettiğinizi unutmayın. Önem düzeyini% 10'a yükselterek her iki hipotezi de reddedebilirsiniz. önem düzeyini% 1'e düşürürseniz her ikisini de reddedemezsiniz.
olasılık

Yanıtlar:


11

İki kuyruklu test her iki yönde de bir fark olup olmadığını test eder. Böylece P değeri t = 1.92 PLUS'un sağındaki t dağılımı altındaki alan t = -1.92'nin solundaki dağılım altındaki alan olacaktır. Bu, tek kuyruklu testin iki katıdır ve bu nedenle P değeri iki kat daha büyüktür.

Tek kuyruklu bir test kullanırsanız, güç elde edersiniz, ancak potansiyel maliyette, veriler alınmadan önce varsayılanın tersi yönde bir farkı göz ardı etmek zorunda kalırsınız. Verileri resmileştirmeden ve hipotezi kaydetmeden önce aldıysanız, gerçekten iki kuyruklu bir test kullanmalısınız. Benzer şekilde, her iki yönde bir efektle ilgileniyorsanız iki kuyruklu bir test kullanırsınız. Aslında, varsayılan yaklaşımınız olarak iki kuyruklu bir test kullanmak ve bir efektin yalnızca bir yönde var olabileceği alışılmadık durumda sadece tek kuyruklu bir test kullanmak isteyebilirsiniz.


Yorumunuz için teşekkürler, Michael. İşte anlamadığım şey: eğrinin altındaki alan iki kuyruklu test için nasıl iki kat daha büyük olabilir? Alfa her iki durumda da aynı olmamalı, çünkü alfa = 0.05?
Lu Ci

sorunuzdaki alfa, p -'nin ne anlama geldiğine (reddetme veya reddetme) karar vermeniz için kesmenizdir. Yani, p'nin değerinin ne olduğunu etkilemez.
John

Biraz nit seçici ama veriyi görmeden önce hipotezi seçmeniz gerektiği fikri gerekli değil. İki adet tek taraflı test yapabilirsiniz. Verilerin tercih etmediği yönü her zaman reddedersiniz. Bu nedenle, veriler tarafından tercih edilen tek taraflı teste gitmek mantıklıdır.
olasılık

1
@probabilityislogic -Alf değerinin gerçek uzun vadeli yanlış pozitif hata oranını yansıtması istendiğinde (yani Neyman-Pearson yaklaşımını kullanmak isterse) tamamen katılıyorum. Tek taraflı bir test kullanır ve gözlemlenen etki temelinde test edilecek değişiklik yönüne karar verirseniz, alfa seviyenizin ima ettiğinden tam olarak iki kat daha fazla yanlış pozitif sonuç elde edersiniz.
Michael Lew

Önceki verileri görmezden gelmeye devam eden biri için sadece uzun vadeli hata oranıdır. Bu, iyi uzun çalışma performansı elde etmek için iyi bir yol değildir. önemle verilen hata oranı, bir kez gözlemlediğimiz tüm veri setlerinin üzerindedir .
olasılık

5

Eğrinin altındaki alan, iki kuyruklu bir test için iki kat daha büyük değildir: Kritik p = .05 değerine sahip iki kuyruklu bir test için, gözlenen verilerin boş bir dağılımın% 2,5'inin alt veya üst kısmından ne kadar sık ​​çekilebileceğini test edersiniz ( Toplam .05). 1 kuyruklu bir testle, verilerin bir (önceden belirlenmiş) kuyruğun aşırı% 5 kuyruktan ne sıklıkla geleceğini test ediyorsunuz.

Kısmen sorunuzun cevabı uygulamalardan biridir: Çoğu araştırmacı, 1 kuyruklu testleri çoğaltma olasılığını rapor eden deneyleri görür (yani araştırmacının istatistiklerini "önemli" olarak almak için bunu seçtiğini varsayar).

Bununla birlikte, geçerli kullanım durumları vardır. Test edilen teori altında ters yönde herhangi bir sonucun imkansız olduğunu biliyorsanız, önceki bir yorumda belirtildiği gibi, bunu önceden belirleyebilir ve 1 kuyruklu bir test yapabilirsiniz. Çoğu insan bunu yine de ihtiyatlı bir şekilde görecektir.


1

Farkın nedeni, her test için kullanılan test istatistiğindeki "gizlidir". hipotez testi için testi temel alacak bir istatistik (yani verilerin fonksiyonu) seçtiğinizi unutmayın. Bu istatistiğe deyin . İstatistik bir bölgede bulunuyorsa null değerini reddedeceğimiz şekilde reddetme bölgesine de ihtiyacınız vardır . şimdi önem seviyesi, sıfırın doğru olduğu zaman istatistiğin reddetme bölgesinde olma olasılığı olarak hesaplanmaktadır.S(D)RR

Şimdi iki taraflı test için test istatistiğireddetme bölgesi ile burada , sizin durumunuzda% 5 olan önem ulaşmak için seçilir . tek taraflı test için test istatistiği ve reddetme bölgesi uygun şekilde seçilmiş için . şimdi her zaman . aynı önemi elde etmek için .| t | > t 0 t 0 α S ( D ) =S(D)=|t||t|>t0t0αS(D)=tt>t1t1Pr(|t|>t0|H0)Pr(t>t0|H0)t0t1

Bu şu soruya yol açar: neden farklı test istatistikleri kullanılır? Bunun nedeni, alternatiflerin farklı olması ve böylece her test istatistiğinin gücünün farklı olmasıdır. Özellikle test istatistiği ve reddini diğer testten kullanırsak, her testin gücü azalır (aynı önemi kullanırsak).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.