Neden alternatif hipoteze ihtiyacımız var?


14

Test yaptığımızda iki sonuç elde ederiz.

1) Sıfır hipotezini reddediyoruz

2) Sıfır hipotezini reddedemiyoruz.

Alternatif hipotezleri kabul etmekten söz etmiyoruz. Alternatif hipotezi kabul etmekten söz etmiyorsak, neden alternatif hipoteze ihtiyacımız var?

İşte güncelleme: Biri bana iki örnek verebilir:

1) sıfır hipotezini reddetmek alternatif hipotezi kabul etmeye eşittir

2) sıfır hipotezini reddetmek alternatif hipotezi kabul etmekle eşit değildir


1
Çünkü bazı sonuçlar çıkarmaya çalışıyorsunuz . Eğer sıfır hipotezi değilse, belki alternatif hipotezdir (sıfır hipotezini reddederseniz alternatif hipotezin geçerli olduğundan tam olarak emin olmasanız bile). Sıfır hipotezini reddettiğinizde, alternatif hipotezin doğru olabileceği sonucuna varmak için bazı "kanıtlarınız" olduğunu söylersiniz.
nbro

@nbro, teşekkür ederim, orijinal yazıma soru ekledim. Bir bakabilir misin?
user1700890

1
Genel olarak hipotez testlerine çok aşina değilim. Daha yetkin bir kişinin sorularınızı cevaplamasını beklemeniz daha iyidir.
nbro

Alternatif hipoteziniz sıfır hipotezin bir tamamlayıcısıysa, bunu kullanmanın bir anlamı yoktur. Hiç kimse pratikte ders kitapları dışında bu nedenle alternatif hipotez kullanmamaktadır.
Aksakal

"Alternatif hipotezleri kabul etmekten söz etmiyoruz" - tüm olası "biz" için doğru değil. Bazı insanlar alternatif hipotezi kabul hakkında konuşmak yapmak, ve diğerleri düşünüyorum onlar karşı tabu saygı bile bunu söyleyerek onu. Doğru olduğuna dair makul bir şüphe olmadığında alternatif hipotezi kabul etmekten kaçınmak biraz bilgiçlikçidir. Ancak, istatistikler yanlış kullanıma çok eğilimli olduğundan, bu durumda bilgiçlik, sonuçların yorumlanmasında dikkatli olunması bakımından muhtemelen iyi bir şeydir.
John Coleman

Yanıtlar:


8

"Alternatif hipotezi kabul etmekten söz etmezsek, neden alternatif hipoteze ihtiyacımız var?"

Çünkü anlamlı bir test istatistiği seçmemize ve çalışmamızı yüksek güce sahip olacak şekilde tasarlamamıza yardımcı olur - alternatif doğru olduğunda null'u reddetme şansı yüksektir. Alternatif olmadan, güç kavramımız yoktur.

Sadece boş bir hipotezimiz olduğunu ve alternatifimizin olmadığını hayal edin. Daha sonra, yüksek güce sahip olacak bir test istatistiğinin nasıl seçileceğine dair bir rehber yoktur. Tek söyleyebileceğimiz, "Değeri boş değerin altında olmayan bir test istatistiğini gözlemlediğinizde null değerini reddet." Rasgele bir şey seçebiliriz: Düzgün (0,1) rasgele sayılar çizebilir ve 0,05'in altında olduğunda null değerini reddedebiliriz. Bu, "nadiren" null değerinin altında,% 5'ten fazla olmamakla birlikte --- yine de null yanlış olduğunda nadirdir. Yani bu teknik olarak istatistiksel bir testtir, ancak herhangi bir şeye karşı veya herhangi bir şeye karşı kanıt olarak anlamsızdır.

Bunun yerine, genellikle bazı bilimsel-makul alternatif hipotez var ( "Orada olan benim deneyde tedavi ve kontrol grupları arasında sonuçlarında pozitif fark"). Bunu, şeytanın savunucuları olarak sıfır hipotezi ortaya çıkaracak potansiyel eleştirmenlere karşı savunmak istiyoruz ("Henüz ikna olmadım --- belki de tedaviniz gerçekten acıyor ya da hiç etkisi yok ve veriler yalnızca örnekleme varyasyonundan kaynaklanmaktadır ").

Bu 2 hipotezi göz önünde bulundurarak, alternatifin altındaki tipik değerleri sıfırın altında olmayan bir test istatistiği seçerek güçlü bir test oluşturabiliriz . (0'dan uzak bir pozitif 2 örnekli t-istatistiği, alternatifin doğru olması şaşırtıcı değildir, ancak null'un doğru olması şaşırtıcıdır.) O zaman test istatistiğinin null altında örnekleme dağılımını anlarız, böylece p-değerlerini hesaplayabiliriz --- ve yorumlayınız. Sıfırın altında olması muhtemel olmayan bir test istatistiğini gözlemlediğimizde, özellikle çalışma tasarımı, örnek büyüklüğü vb. Yüksek güce sahip olacak şekilde seçildiyse , bu alternatif için bazı kanıtlar sağlar .

Peki, neden yok biz "kabul" alternatif hipotez hakkında konuşmak? Çünkü yüksek güçlü bir çalışma bile sıfırın yanlış olduğuna dair kesin bir kanıt sağlamaz . Hala bir tür kanıt, ama diğer bazı kanıtlardan daha zayıf.


7

Tarihsel olarak, alternatif bir hipotezin gerekli olup olmadığı konusunda anlaşmazlık vardı. Bu anlaşmazlık noktasını, Fisher ve Neyman'ın, sıkça istatistik ve Bayes yanıtı bağlamında düşünerek ele alalım.

  • Fisher - Alternatif bir hipoteze ihtiyacımız yok; sadece uygunluk testi kullanarak sıfır hipotezini test edebiliriz. Sonuç, sıfır hipotezi için bir kanıt ölçüsü sağlayan bir p değeridir.

  • Neyman - Boş ve alternatif arasında bir hipotez testi yapmalıyız. Test, sabit, önceden belirlenmiş bir oranda α -1 tipinde hatalara neden olacak şekildedir . Sonuç bir karardır - sıfır hipotezini α düzeyinde reddetmek ya da reddetmemek .

    Karar teorik bakış açısından bir alternatife ihtiyacımız var - iki eylem tarzı arasında bir seçim yapıyoruz - ve testin gücünü bildirmeliyiz -

    1p(Accept H0|H1)
    Alternatif doğru olduğundaH0 reddetme şansına sahip olmak için mümkün olan en güçlü testleri aramalıyız.

    Her iki noktayı da yerine getirmek için, alternatif hipotez belirsiz ' H0 değil' olamaz .

  • p(H0)=1
    H0p(data|not H0)


1
Son noktanız mükemmel ve tüm argümanlarını motive edilmemiş tek bir NHST'ye dayanan yayınlarda genellikle ihmal ediliyor.
Konrad Rudolph

H0

p(data|notH0)

@innisfree sık sık anlayışı altında değil, muhtemelen Bayesian altında.
Michael

En az 2 model tanıtmadan bunu deneyin ve yapın ...
innisfree

4

Bunun resmi bir gereklilik olup olmadığından% 100 emin değilim ama tipik olarak sıfır hipotezi ve alternatif hipotez: 1) tamamlayıcı ve 2) kapsamlı. Yani: 1) ikisi de aynı anda doğru olamaz; 2) biri doğru değilse diğeri doğru olmalıdır.

heightboys=heightgirlsheightboysheightgirls


1
H0HaH0Ha

2
H0H1

1
H0HaH0HaHaH0HaH0Ha

1
@innisfree biri iki nokta hipotezini bir çeşit olasılık çerçevesinde test edebilirdi - elbette. Ancak bu prosedür "sıfır hipotez testi" olarak adlandırılamaz ve kesin değildir. Hiçbirinin doğru olmadığı durumlarda bile en yakın olanı doğru olarak seçer. Ayrıca güçle ilgili olarak - testin gücünü hesaplarken alternatif bir hipotez veya etki büyüklüğü seçilebilir, ancak (benim görüşüme göre) test yapıldıktan sonra bunu unutmalıdır. Ona verilerde bulunan olası etkileri anlatan bazı bilgiler olmadıkça. Gürültülü bir fotoğraftaki belki beyaz / siyah pikseller gibi.
Karolis Koncevičius

1
θ=1H0θ{0,1}H0H1

2

Neden alternatif bir hipoteze ihtiyacımız var?

Klasik bir hipotez testinde, alternatif hipotezin oynadığı tek matematiksel rol, seçilen test istatistiği yoluyla kanıtların sırasını etkilemesidir. Alternatif hipotez, sıfır hipotezine en uygun olanlardan (belirtilen alternatife karşı) sıfır hipotezlerine en az elverişli olanlara kadar olası tüm veri sonuçlarının sıralı bir sıralamasının ayarlanmasına eşdeğer olan test için uygun test istatistiğini belirlemek için kullanılır. (belirtilen alternatife karşı). Olası veri sonuçlarının sıralı sıralamasını oluşturduktan sonra , alternatif hipotez testte daha fazla matematiksel rol oynamaz .


nx=(x1,...,xn)T:RnRverilerin olası her sonucunu, sıfır veya alternatif hipoteze daha elverişli olup olmadığını ölçen sıralı bir ölçekte eşler. (Genelliği kaybetmeden, düşük değerlerin sıfır hipoteze daha elverişli olduğunu ve daha yüksek değerlerin alternatif hipoteze daha elverişli olduğunu varsayacağız. Bazen test istatistiğindeki daha yüksek değerlerin daha aşırı olduğu sürece "daha aşırı" olduğunu söyleriz. Alternatif hipotez için kanıtlar.) Testin p değeri daha sonra şu şekilde verilir:

p(x)pT(x)P(T(X)T(x)|H0).

Bu p-değeri fonksiyonu, herhangi bir veri vektörü için testteki kanıtları tam olarak belirler. Seçilen bir önem seviyesi ile birleştirildiğinde, herhangi bir veri vektörü için testin sonucunu belirler. (Veri noktaları sabit sayıda için tarif etmişlerdir ama bu kolayca rasgele izin vermek için uzatılabilir .) P-değeri, test istatistik etkilendiğini not etmek önemlidir , sadece bir sıralama ölçeği üzerinden bu indüklernnyani, test istatistiklerine monoton olarak artan bir dönüşüm uygularsanız, bu hipotez testinde bir fark yaratmaz (yani, aynı testtir). Bu matematiksel özellik sadece test istatistiğinin tek amacının hangisinin null / alternatif için daha elverişli olduğunu göstermek için tüm olası veri vektörlerinin alanı üzerinde sıralı bir ölçek oluşturmak olduğu gerçeğini yansıtır.

Alternatif hipotez bu ölçümü sadeceT genel model içinde belirtilen boş ve alternatif hipotezlere dayanarak seçilen fonksiyonu ile etkiler . Bu yüzden, bir fonksiyonu olarak test istatistiği fonksiyonu kabul edilebilir genel modeli ve iki hipotez. Örneğin, bir olasılık-oran-testi için, test istatistiği, olasılık fonksiyonunun üst değerlerinin sıfır ve alternatif hipotezlere ilişkin parametre aralıkları üzerinden bir oranı (veya bir oranın logaritması) alınarak oluşturulur.Tg(M,H0,HA)M


Testleri farklı alternatiflerle karşılaştırırsak bu ne anlama geliyor? Sabit bir modeliniz var ve aynı boş hipotez iki farklı ve alternatifiyle karşılaştıran iki farklı hipotez testi yapmak istediğinizi . Bu durumda iki farklı test istatistiği fonksiyonunuz olacaktır:MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

karşılık gelen p-değeri fonksiyonlarına yol açar:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

Eğer ve birbirlerinin monotonik artan dönüşümleri ise, ve p-değeri işlevlerinin aynı olduğunu, bu nedenle her iki testin de aynı test olduğunu belirtmek önemlidir . Eğer ve fonksiyonları birbirinin monotonik artan dönüşümleri değilse, o zaman gerçekten iki farklı hipotez testimiz vardır.TTppTT


2
Testin aşırı sonuçlarla karşılaşıldığında sıfır hipotezini reddetmek için tasarlandığını söyleyerek buna katılıyorum ve alternatif hipotezin rolü, sıfır hipotezi doğruysa sonuçların aşırı görüleceği noktasını belirtmektir
Henry

1

P(data|H0)H0

α

Alternatif bir hipotez formüle etmenizin nedeni, örneklemeye başlamadan önce aklınızda muhtemelen bir deney yapmış olmanızdır. Alternatif bir hipotez formüle etmek, tek kuyruklu veya iki kuyruklu bir test kullanıp kullanmayacağınıza ve böylece size daha fazla istatistiksel güç (tek kuyruklu senaryoda) vermenize de karar verebilir. Ancak teknik olarak testi çalıştırmak için alternatif bir hipotez formüle etmeniz gerekmez, sadece verilere ihtiyacınız vardır.


P(data|H0)P(data as extreme as that observed|H0)

@innisfree Aynı fikirdeyim ve aynı cümlede veriyi tam olarak bu şekilde tanımladım.
Stefan

? Verilerin tanımlandığı hiçbir yerde göremiyorum (bu şekilde veya başka bir şekilde)
innisfree

Ve öyle olsa bile, neden yapıyorsun? Veriler neden bu şekilde yeniden tanımlanıyor? P çevresindeki metnin bölümlerini açıklığa kavuşturmanızı öneririm (veriler ..
innisfree
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.