P =% 5.0 anlamlı mı?


14

Bugün, 0.05'lik bir p değerinin (tam olarak) anlamlı kabul edilip edilmediği (alfa =% 5 verildi) soruldu. Cevabı bilmiyordum ve Google her iki yanıtı da ortaya koydu: (a) p% 5'in altındaysa sonuç önemlidir ve (b) p% 5'in altında veya% 5'e eşitse sonuç önemlidir.

Tabii ki, bu web sitelerinin hiçbiri kimseden alıntı yapmadı. Neden biri - bu ortak bilgi ve% 5 zaten keyfi. Ancak bu, öğrencilerime hatırlamaları gereken bir şey söylememe yardımcı olmaz.

İşte, hipotezleri test etme konusundaki umutsuz sorularım: Eğer p değeri tam olarak alfa ise - sonucu önemli mi görüyorum? Ve bu durumda otorite atıf nedir?

Çok teşekkür ederim

Yanıtlar:


19

Bazı pratik konuları bir kenara bırakmak (örneğin, ne kadar keyfi olduğu gibi), önem düzeyi ve p-değeri tanımları bu sorunun cevabını açıklığa kavuşturmaktadır.α

Yani resmen reddetme kuralı olduğunda reddetmenizdir .p=α

Gerçekten sadece ayrık durum için önemli olmalı, ancak bu durumda, olduğunda reddetmezseniz , tip I hata oranınız aslında !αp=αα

(Bana göre 'yetkili' bir alıntı yok; gerçekten hem Neyman-Pearson hem de Fisherian'ın hipotez testine yaklaşımları ile uğraşmanız gerekiyor ve bu zamanla gelişen bir şey.)

Hipotez testini doğru bir şekilde tanımlayan çok sayıda iyi istatistik metni vardır.

P-değerinin tanımı, ilgili Wikipedia makalesinin ilk cümlesinde doğru olarak verilmiştir *:

p değeri, sıfır hipotezinin doğru olduğu varsayılarak, en azından gerçekte gözlemlenen kadar yüksek bir test istatistiği elde etme olasılığıdır.

* (ve hayır, wikipedia bir otorite değil, sadece tanımın doğru olduğunu söylüyorum)

Basitlik için nokta null'lara sadık kalalım; suları ek sorunlar ile çamurlamadan noktaya ulaşmaya hizmet eder.

Şimdi önem seviyesi, seçilen tip I hata oranıdır. Bu, doğru olduğunda reddedilecek sıfır hipotezini seçtiğiniz orandır. Yani, null değerini reddetmeniz gereken zamanın oranıdır . Şimdi ayrık dağılımlı bir test istatistiği düşünün - tam olarak olan bir gerçekte mümkündür **. (Aynı zamanda, gerçek alfa% 5 gibi güzel ve yuvarlak bir şeyden farklı olacaktır.)p ααp α

** Sanırım tartışmamı sadece tamamen veya tamamen sürekli dağıtılmış test istatistikleriyle sınırlandırıyorum. Karışık durumda, ayrı tartışmamın nasıl uygulandığını anlayabilirsiniz (geçerli olduğu durumlarda).

örneğin ile iki kuyruklu bir işaret testi düşünün . % 5'e ulaşılabilen en yakın anlamlılık seviyesi% 4.904'tür. Öyleyse 'i seçelim (veya daha kesin olmak gerekirse, ).α = 4.904 % 137500n=17α=4.904%137500217

Yani doğrudur ne zaman reddetmesi halinde, iade oranının ne ? Bir şekilde halledebiliriz. % 4.904 - seçtiğimiz . p = α αH0p=αα

Diğer yandan, doğru olduğunda, olduğunda reddetmezsek reddetme oranı nedir? Bir şekilde halledebiliriz. Sadece% 1.27. çok daha az . Kaydolduğumuz test bu değil! p = α αH0p=αα

Yani, reddetme bölgesinde ise testlerimiz (oldukça açık!) İstenen özelliklere sahiptir .p=α

[Şimdi durumunuzu ele alalım. P değeriniz aslında tam olarak% 5 mi? Bahse girerim , birkaç farklı nedenden dolayı tam olarak bu değildir . Ancak her durumda, resmi olarak bir ret olduğunu belirtebilirsiniz .]p=α

Eğer betimliyorsa ret kuralı ön ve (varsayımlar memnun iseniz) olduğunu göstermektedir, bu arzu anlamlılık düzeyi, muhtemelen referanslar için gerek yoktur vardır.

Reddetme kuralı, test istatistiğinin hangi değerlerinin reddetmenize neden olacağına . Reddetme bölgesini tanımlamaya eşdeğerdir ( reddetme bölgesi terimini düz terimlerle tanımlayan Casella ve Berger, İstatistiksel Çıkarım , s346 ).H0

Aynı kitap, p-değerlerini (p364) wikipedia'dan farklı terimlerle tanımlar (ancak aynı sonuç anlamı) - yani (belirli bir veri kümesi için), null değerinin reddine yol açacak en küçük tanımlar. .α

(Farklı bir sürümünüz varsa sayfa numaraları değişebilir, ancak bir dizini vardır, bu nedenle terimlere bakabilirsiniz; dikkat edin, bulmak için 'Hipotez testi' altındaki listelere veya dizinde benzer bir şeye bakmanız gerekebilir. 'ret bölgesi')

Hmm, raftan başka bir kitap deneyelim. Wackerly, Mendenhall & Scheaffer Matematiksel İstatistikler ve Uygulamalar, 5. baskı , p412'de bir reddetme bölgesi ve p431'de bir p değeri (C&B ile aynı def) tanımlar.


Teşekkür ederim. Lütfen "pratik istatistik kullanıcısı" nın aptal sorusuna izin verin: Wikipedia dışında bu tanımı ve / veya ret kuralını nerede bulacağım? Bazı istatistik kitapları taradım ama geçidi bulamadım. Muhtemelen yanlış kelimeleri arıyor ...
BurninLeo


Sen müthişsin! Tabii, bunu biliyordun, ama bazen yine de belirtmeye değer. Çok teşekkürler!
BurninLeo

1
(+1) Gerçekten güzel bir cevap.
chl

2

Erken biyoistatistik dersimde bir profesörden öğrendiğim ilginç bir itiraf, 0.05 anlamlılık seviyesinin daha çok altın gerçeklikten ziyade bir fikir birliğine varılmış olmasıdır. O zamandan beri, "yaklaşma" gibi, 0.05 anlamlılık düzeyiyle flört eden literatürün hala araştırmanın çarpıcı bir bulgusu olduğunu gördüm ve 0.05 anlamlılık seviyesinin tüm araştırma alanları için geçerli olmayabileceğine dair argümanlar duydum. Bununla birlikte, nokta tahminlerinin ve güven aralıklarının önem seviyelerinden daha bilgilendirici olduğunu gördüm. İşte bu konuda ilginç bir makale (yine de bana).


@ User2300643 referansı için teşekkürler. Ve erişim için finansal engelden kaçındığınız için teşekkürler!
doug.numbers

Burada% 5 gibi önem seviyelerinin kökenleri hakkında ilginç bir tartışma var .
Glen_b-Monica'yı

0

P'nin değeri genellikle daha önce belirtildiği gibi (veya daha doğrusu tembellik) konsensüs için ayarlanır. Bir şeyin önemli olduğunu gerçekten söyleyebilmek için, efekt boyutuna, örnek boyutuna ve verileriniz için ne kadar katı olmasını istediğinize ilişkin p değerini bulmalıyız. Buna güç analizi (istatistik içinde bir alt alan) denir. Birçok insan ya farkında değil ya da basitçe kullanmıyor çünkü basit değil. Bu öyle olduğu anlamına gelmez. Gerçekten anlamlı çıkarımlar çizmek için her zaman bu tür bir çalışma yapmalıyız.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.