Tek kuyruklu hipotez testinin gerekçesi


35

İki kuyruklu hipotez testini anlıyorum. You have (genel ). -değeri olasılığıdır gözlemlenmiş olana kadar aşırı gibi en az verileri üretir.H0:θ=θ0H1=¬H0:θθ0pθ

Tek kuyruklu hipotez testlerini anlamıyorum. Burada, (vs. ). P değerinin tanımı, yukarıda değiştirildi olmamalıdır: hala olasılığı olmalıdır gözlemlenmiş olana kadar aşırı gibi en az verileri üretir. Ama yok biliyorum o tarafından üst sınırlanmış olan tek o, .H0:θθ0H1=¬H0:θ>θ0θ θθ0

Bunun yerine, ben metinler varsaymak bize söylemeden gördükleri (değil uyarınca ) ile bu ama sadece bir uçta, gözlenen ne gibi aşırı uçta en azından verileri üretir olasılığını hesaplamak . Bunun, teknik olarak hipotezlerle hiçbir ilgisi yok gibi görünüyor.θ=θ0θθ0H0

Şimdi, bunun sıkça yapılan hipotez testi olduğunu ve bu sıklıkta çalışanların teta'larına öncelik vermediğini anlıyorum . Fakat bu sadece, yukarıdaki hesaplamayı resme atmaktan ziyade, varsayımların kabul edilmesi veya reddedilmesinin mümkün olmadığı anlamına gelmemeli midir?θ


Benzer bir soru daha sonra soruldu istatistik.stackexchange.com/questions/8196/…
robin

1
değeri tanımınız eksik. Bu (vurgu) şöyle olmalıdır: -değeri olasılığıdır gözlemlenmiştir ne kadar aşırı gibi en az veri oluşturur boş hipotezin doğru olduğunu varsayarak . ppθ
Alexis

Yanıtlar:


34

Bu düşünceli bir soru. Pek çok metin (belki de pedagojik nedenlerden dolayı) bu konuyla ilgili makale. Gerçekten oluyor ki bir olan kompozit senin tek yanlı bir durumda "hipotezi": aslında hipotezler bir dizi değil, tek kişi o. Bu gerekli olan bu olası her hipotez içinH0 H0Test istatistiğinin kritik bölgeye düşme olasılığı test boyutuna eşit veya daha küçük olmalıdır. Dahası, eğer test aslında nominal büyüklüğüne ulaşmaksa (ki bu yüksek güç elde etmek için iyi bir şey), o zaman bu şansların üstünlüğü (tüm boş hipotezleri üstlenerek) nominal büyüklüğe eşit olmalıdır. Uygulamada, belirli "güzel" dağıtım ailelerini içeren konumun basit tek parametreli testler için, bu supremum, parametresiyle hipotez için elde . Dolayısıyla, pratik bir mesele olarak, tüm hesaplamalar bu bir dağılıma odaklanmaktadır. Ancak setinin geri kalanını : bu iki taraflı ve tek taraflı testler arasında (ve "basit" ve "bileşik" arasında çok önemli bir ayrımdır.H 0θ0H0

Bu, tek taraflı testlerin sonuçlarının yorumlanmasını incelikle etkiler. Boş değer reddedildiğinde, kanıtların herhangi bir dağıtımın gerçek doğasına karşı olduğuna işaret . Boş reddedilen değilken, sadece söyleyebiliriz vardır bir dağıtım gözlenen verilerle "tutarlı" dır. Biz edilir değil söyleyerek tüm içinde dağılımları verilerle tutarlıdır: münasebet! Birçoğu son derece düşük olasılıklar verebilir.H 0 H 0H0H0H0


Söylediğin her şey geçerli ve önemli. Sanırım bir diğer önemli yön de, genellikle sıfır olan hipotezin ilginç olmayan hipotez olarak görülmesidir. Alternatif bilimsel hipotez olarak görülür. Deneycinin kanıtlamak istediği kişi bu. Genelde denklik ve aşağılıksızlık testlerinde farklı olduğu için derim. Şimdi tek taraflı test konusuna gelince, sadece parametrenin değeri ilginç olan boş değerden daha büyük olan taraf söyleniyor. Bu yüzden, daha küçük taraftaki tüm değerler boşa dahil edilir.
Michael Chernick

stats.stackexchange.com/questions/333301/… Bu sorunun cevabını vermek ya da bana bir bibliyografyaya işaret etmek istiyorsan ...;)
Denizdeki yaşlı bir adam.

6

değerini , bir tip I hatasının maksimum olasılığı olarak görüyorum . Eğer , bir tip I hata oranı olasılığı etkili bir sıfır olabilir, ancak öyle olabilir. Teste minimal bir perspektiften bakıldığında, bir rakip hiçbir zaman boş hipotezin 'iç kısmında' asla derinden çekmez ve güç etkilenmemelidir. (Basit durumlar için örneğin -test) tür bir boş hipotez taraflı sağlayan bir garanti maksimum tip I oranı ile bir test inşa etmek mümkündür.θ θ 0 tpθθ0t


2

Yalnızca bir yöndeki sonuçlar ulaşmaya çalıştığınız sonucu desteklediğinde, tek taraflı bir hipotez testi kullanırsınız.

Bunu sorduğunuz soru açısından düşünün. Örneğin, obezitenin kalp krizi riskinin artmasına neden olup olmadığını görmek istediğinizi varsayalım. 10 obez ve 10 obez olmayan kişiden oluşabilecek verilerinizi toplarsınız. Diyelim ki, kaydedilmemiş kafa karıştırıcı faktörler, zayıf deneysel tasarım veya sadece kötü şans nedeniyle, obez olmayan 10 kişiden sadece 2'sine kıyasla obez 10 kişiden 2'sinin kalp krizi geçirdiğini gözlemlediniz.

Şimdi, bu veriler üzerinde 2 taraflı bir hipotez testi yapacak olsaydınız, obezite ve kalp krizi riski arasında istatistiksel olarak anlamlı bir ilişki (p ~ 0.02) olduğu sonucuna varacaksınız. Bununla birlikte, dernek, görmeyi beklediğinizin tam tersi yönde olacaktır, bu nedenle test sonucu yanıltıcı olacaktır.

(Gerçek hayatta, böyle bir önyargılı sonuç üreten bir deney kendi içinde ilginç sorulara yol açabilir: örneğin, veri toplama sürecinin iyileştirilmesi gerekebilir veya işte önceden bilinmeyen risk faktörleri olabilir veya belki de geleneksel bilgelik yanlıştır. Ancak bu konular ne tür bir hipotez testi kullanılacağı konusundaki dar soru ile ilgili değildir.)


2

-değeri, ilgili olayı olasılığıdır koşuluyla geçerlidir . Mümkün olan en basit oyuncak örneği iki bozuk para atışıdır. 2 taraflı madeni para fuarını düşünürsünüz, yani bir baş ve bir kuyruk atıyorsunuz. Bunun olasılığı . Bu durumda , bir tarafa ya da diğerine eğilimli olduğunu düşünüyorsunuz, yani iki ya da iki kuyruk atarsınız. Olasılık tekrar, H 0 H 0 , 0.5 , H 1 , 0.5pH0H00.5H10.5

1 taraflı bir için paranızı bir oyun düşünün. Madeni para adil olmakla birlikte elbette ama elbette kafalara doğru eğilimli olması da rahat. Bu, burada bir baş ve bir kuyruk veya iki başın olasılıkları vardır : olasılık. , faul dediğiniz iki geriye kalan durumdur: olasılık. Unutmayın ki, tüm bölgeyi adil olmaktan, kafalara doğru saptırdığınız için varsayılan iki kuyruk olarak kabul edilirsiniz.H 0 0.75 H 1 0.25H0H00.75H10.25

Şimdi olaylarımız yine de gerçekleştiğinde, olasılıkları ilgili 'ların doğru olması şartı altında p değerleridir - yukarıda belirtildiği gibi. Dolayısıyla güven seviyenize bağlı olarak reddedebilir veya reddedebilirsiniz .H 0 H 0H1H0H0

Bu oyuncak örneğini R'de kendiniz deneyebilir, farklı kesin sayıları ve kafa ve kuyruk kombinasyonlarını da denemelisiniz:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.