Güven aralıkları ile hipotez testleri arasındaki fark nedir?


28

Bazı yorumcularla hipotez testinin kullanılmaması gerektiğini öne süren hipotez testiyle ilgili tartışmaları okudum . Bazı yorumcular bunun yerine güven aralıklarının kullanılması gerektiğini önermektedir .

  • Güven aralıkları ile hipotez testleri arasındaki fark nedir? Referans ve örnekler ile açıklama takdir edilecektir.

5
Bence , güven aralığını göstererek hipotez test sonuçlarını bildirmenin neden bir şeylerin bir miktar p değeri düzeyinde onaylandığını veya reddedildiğini söylemekten daha iyi olduğunu sormak istediğinizi düşünüyorum .

3
Diğer sorularınızın bazılarını cevaplandığı gibi kontrol etmelisiniz.
Andy W

Yanıtlar:


19

Hipotez testi için bir güven aralığı (CI) kullanabilirsiniz. Tipik durumda, bir etkinin CI değeri 0 değilse, boş hipotezi reddedebilirsiniz. Ancak bir CI daha fazlası için kullanılabilir, oysa, geçip geçmediğini bildirmek bir testin yararlılık sınırıdır.

Örneğin, sadece bir t testi yerine CI kullanmanızın nedeni, o zaman sadece hipotezleri test etmekten daha fazlasını yapabilmenizdir. Olası olduğuna inandığınız etkilerin yelpazesi hakkında bir açıklama yapabilirsiniz (CI'dekiler). Bunu sadece bir t testi ile yapamazsın. Ayrıca, t testi ile yapamayacağınız boş ile ilgili açıklamalar yapmak için de kullanabilirsiniz. Eğer t-testi boşluğu reddetmiyorsa, boşuna reddedemeyeceğinizi söylüyorsunuz, ki bu pek bir şey ifade etmiyor. Ancak, boş değer etrafında sınırlı bir güven aralığınız varsa, boş değerin ya da buna yakın bir değerin gerçek değer olduğunu ve tedavinin ya da bağımsız değişkenin etkisinin anlamlı olamayacak kadar küçük olduğunu önerebilirsiniz ( ya da denemenizin yapmadığını

Daha Sonra Eklendi: Gerçekten de şunu söylemeliydim, bir CI'yi bir test gibi kullanabiliyorken bir tane değil. Parametre değerlerinin yalan söylediğini düşündüğünüz bir aralık tahminidir. Çıkarımlar gibi bir test yapabilirsin, ama hiç böyle konuşmamayı çok daha iyi yapıyorsun.

Hangisi daha iyi?

A) Etki 0.6, t (29) = 2.8, p <0.05'tir. Bu istatistiksel olarak anlamlı etkisinin olduğunu ... (Bir Neyman- Pearson çerçevesinde veya bulgunun büyüklükte pratik ima tartışmak bile güçlü yeteneği davranış aynen bu istatistiksel anlamlılık hakkında bazı tartışma ensues ... büyüklüğü t ve p değerleri hemen hemen anlamsızdır ve tartışabileceğiniz tek şey, etkinin var olup olmadığı ya da bulunmadığıdır.

veya

B) % 95 güven aralığı kullanarak etkinin 0,2 ile 1,0 arasında olduğunu tahmin ediyorum. (bazı tartışmalar, çıkarılabilir değerlerin, herhangi bir özel anlamı olan ve tam olarak ne anlama gelmesi gerektiği için önemli olan herhangi bir kelimeyi kullananlar olup olmadığına dair, söz konusu çıkarın gerçek etkisinden bahsetmeyi sağlar. Buna ek olarak, CI’nın genişliği doğrudan Bunun güçlü bir bulgu olup olmadığı veya yalnızca daha kesin bir sonuca varıp ulaşamayacağınıza dair bir tartışma)

Temel bir istatistik dersi aldıysanız, başlangıçta A'ya yönelebilirsiniz. Bir sonucu rapor etmenin daha iyi bir yolu olduğu bazı durumlar olabilir. Ancak çoğu iş için B, çok uzakta ve üstündür. Bir aralık tahmini bir test değildir.


@John 'un yorumlarına bir ek: İlk olarak, bazen temel soru CI' nin 0 değil 1'in (örneğin lojistik regresyon) yayılıp yayılmadığıdır.
Peter Flom - Eski Monica

Beyler, 1 mi yoksa 0 mı? (Bu bana çok aydınlatıcı görünüyor, bu yüzden sanırım, dikkat etmek için doğru değeri öğrenmem gerek!) @John
Adhesh Josh

% 95 CI ve iki kuyruklu test hipotezi ile alfa = 0,05 arasındaki ilişki nedir? onlar aynı mı? Öyleyse nasıl?
aşk istatistikleri

aşk istatistikleri, aynı kullanıldığı zaman onlar aynıdır.
John

Adhesh Josh, boş hipotez önceden belirlenmiş herhangi bir sabit değer olabilir. Düz NHST üzerinden CI'nin bir başka özelliği. 0'dan farklı bir varsayımsal değere karşı test yapmak istediğinizde kullanımı çok kolaydır.
John

7

Hipotez testleri ile güven aralıkları arasında bir denklik vardır. (bkz. örneğin http://en.wikipedia.org/wiki/Confidence_interval#Statistical_hypothesis_testing ) Çok özel bir örnek vereceğim. Diyelim ki , ortalama ve variance 1 olan normal bir dağılımdan, yazacağımız örneğimize sahipsin . Diyelim ki ve boş hipotezi düzeyini düzeyinde test etmek istiyoruzBu yüzden bir test istatistiği yaparız, bu durumda örnek ortalama olarak kabul edeceğiz: . Şimdi diyelimx1,x2,,xnμN(μ,1)μ=mH0:μ=m0.05.v=(x1+x2++xn)/nA(m)bu test için için "kabul bölgesi" dir . Bu, 'nin boş hipotezi düzeyinin 0.05 düzeyinde kabul edildiği değerinin olası değerleri kümesi olduğu anlamına gelir. boş hipotezin doğru olduğu sonucuna varmanız.). Bu örnekte, normal dağılımına bakabilir ve bu dağılım altında en az 0.95 olasılığı olan herhangi bir set seçebiliriz. Şimdi, bir% 95 güven bölgesi tüm dizi olan içinde . Başka bir deyişle, tümvA(m)vμ=mN(m,1)μmvA(m)mkendisi için boş-hipotez gözlenen kabul edilecektir . Bu yüzden John şöyle diyor: “Bir efekt için CI yayılmazsa, boş hipotezi reddedebilirsiniz.” (John sınama durumu ile ilgilidir )v0μ=0

İlgili bir konu p değeridir. P değeri, boş hipotezi reddedeceğimiz bir test için en küçük seviyedir. Güven aralıkları tartışması ile bağdaştırmak için , farklı boyutlarda güven aralıkları oluşturduğumuz belirli bir ortalama ortalama aldığımızı varsayalım . için% 95'lik bir güven aralığı içermediğini varsayalım . O zaman null hipotezini düzeyini düzeyinde reddedebiliriz Öyleyse, güven aralığını sadece değerine değene kadar (ama içermez) büyütdüğümüzü varsayalım ve bunun% 98'lik bir güven aralığı olduğunu varsayalım. Daha sonra hipotez için p değeri ise biz elde (vμmμ=m0.05.mμ=m0.0210.98 ).


Lütfen bunu okuyun, çünkü p-değeri null reddetmek için en küçük test seviyesi olarak yorumlanamaz. “Tek (veya devam eden) deneylerde p değerlerinin yorumlanmasının bir Neyman-Pearson hipotez testi bağlamında izin verilmediği zaten gösterilmiştir. Ap değerinin hesaplanması yalnızca boş hipotezin gerçekliğine bağlıdır. HA'yı destekleyen kanıt miktarı; H0'a karşı endüktif kanıtın bir ölçüsüdür. " 'Kaynak: ftp.stat.duke.edu/WorkingPapers/03-26.pdf
sree22

@ sree22 bu konuda genişleyebilir veya bir yeniden değerlendirme önerebilir misiniz? Bir yorum değil, bu bağlamda p-değeri tanımını vermeye çalışıyordum.
DavidR

3

Öğrenci, hangi etkilerin daha önemli olduğu kadar önemli olduğunu gösterebildikleri gerekçesiyle güven aralıklarını savundu.

Örneğin, birincisinin finansal etkisi için bir değerin 5 TL'den 6 TL'ye kadar güven aralığında, ikincisinin 200 TL'den 2800 TL'ye kadar güven aralığında olduğu iki etki bulursanız. Birincisi istatistiksel olarak daha önemlidir ancak ikincisi muhtemelen daha önemlidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.