P <0.001, p <0.0001 veya daha düşük p değerleri kullanan çalışma örnekleri?


11

P <0.05'in norm olduğu sosyal bilimlerden geliyorum, p <0.1 ve p <0.01 de ortaya çıkıyor, ama merak ediyorum: eğer varsa, hangi çalışma alanlarının ortak olarak daha düşük p değerleri kullandığı standart?

Yanıtlar:


9

Benim düşüncem, bunun çalışma alanına bağlı olmadığı (ve olması gerektiği). Örneğin, iyi daha düşük anlamlılık düzeyinde çalışabilir , sen tarihsel ya da köklü sonuçlarla bir çalışma çoğaltmak için çalışıyoruz (örneğin I çeşitli çalışmalarda aklınıza gelebilecek eğer Stroop etkisi neden olmuştu, son birkaç yıldaki bazı tartışmalara). Bu, hipotezi test etmek için klasik Neyman-Pearson çerçevesi içinde daha düşük bir "eşik" olarak düşünülür. Bununla birlikte, istatistiksel ve pratik (veya esaslı) önem bir başka konudur.p<0.001

H0


Lütfen düşünceler dizilimimi düzeltin: bazı alanlar, örneğin biyokimyasal maruziyete odaklanabilir ve bu nedenle sağlık tehlikesine yol açabilecek herhangi bir Tip I hatasını önlemek için p <0.001 kullanmak isteyebilir. Ayrıca, bu boyunca maddeye dan Am Psych , ben de büyük bir çalışmayı hatırlamak Sociol Am J ı takip ettiğini veya soc bilim dergilerinde birini. Benim favorim elbette Ziliak ve McCloskey .
Fr.

1
Burada açıkladığınız şey geri geliyor. Biyokimyasal maruziyet ile bir şeylerin orada olmadığını söyleyerek Tip II hataları hakkında endişelenirim. Bu durumda alfa'yı daha yükseğe değil, daha yükseğe ayarlayabilirim.
John

Testin şu formda olacağı varsayımıyla çalışıyordum: "Hamileliğin HRT ile ilişkili olup olmadığını değerlendirelim" (bu durumda, Tip I hatası Tip II hatadan daha ciddidir, ancak belki de bu tasarım standart değildir).
Fr.

7

Herkesin önceden belirlenmiş bir alfa düzeyini, örneğin 0.01'den düşük kullanması nadir olabilir, ancak insanların gözlemlenen bir P değerinin daha düşük olduğuna dair yanlış inançta insanların 0.01'den küçük bir zımni alfa talep ettikleri neredeyse nadir değildir. 0.01, 0.01'den küçük bir Neyman-Pearson alfa ile aynıdır.

P=0.0023α=0.00230.0023P=0.05P=0.00230.05

Göz at Hubbard ve arkadaşları. Klasik İstatistiksel Testte Kanıtlar (p'ler) ve Hatalara (α) Karşı Karışıklık. Amerikan İstatistikçi (2003) cilt. 57 (3)


Ayrımı anlıyorum, ancak muhtemelen rutin olarak hata yapıyorum. Ama sorum şu, orada bir yerde, örneğin p <.0001 'in geleneksel kullanımı var mı? Yoksa, kışkırtıcı bir şekilde söylemek gerekirse, p <.05 kült evrensel mi?
Fr.

P <0.05'in kültü neredeyse evrensel olabilir, ancak bu noktadaki herhangi bir iddiadan emin olmak mümkün değildir, çünkü görünür istisnaların Fisher ve Neyman-Pearson yöntemlerinin bilinmeyen hibridizasyonunun sonucu olması muhtemeldir. Temel farmakolojik araştırma makalelerinde, Neyman-Pearson hata oranlarının kullanımı ile ilgili neredeyse hiçbir zaman açık bir ifade bulunmamaktadır.
Michael Lew

Örnek için teşekkürler. Farmakolojik araştırmalardan giderek daha fazla etkilendim, birçok bilimsel nedenden ötürü…
Fr.

1
Temel farmakolojik araştırma hakkındaki yorumumu o alanın özel bir eleştirisi olarak almamalısınız, bu sadece benim kendi özel disiplinim ve dolayısıyla en çok deneyimlediğim alan. Temel araştırmada, hibridize P değerleri ve hata oranları ile ilgili aynı eksikliklerle birçok alan bulacağınızdan eminim.
Michael Lew

Endişeye gerek yok, bu eksikliğin soruşturma alanlarına iyi gittiğini kolayca hayal edebiliyorum.
Fr.

3

Bu literatüre çok aşina değilim, ancak bazı fizikçilerin istatistiksel testlerde çok daha düşük eşikler kullandıklarına inanıyorum, ancak bunlar hakkında biraz farklı konuşuyorlar. Örneğin, bir ölçü teorik tahminden üç standart sapma ise, “üç sigma” sapması olarak tanımlanır. Temel olarak, bu, ilgili parametrenin α = .01 ile az testinde öngörülen değerden istatistiksel olarak farklı olduğu anlamına gelir. İki sigma kabaca a = .05'e eşittir (aslında 1.96 σ olacaktır). Yanılmıyorsam, fizikteki standart hata seviyesi 5 sigma, α = 5 * 10 ^ -7

Ayrıca, nörobilim veya epidemiyolojide, çoklu karşılaştırmalar için rutin olarak bazı düzeltmeler yapmak giderek yaygınlaşmaktadır. Her bir test için hata seviyesi bu nedenle p <.01'den düşük olabilir


1
α=5×108

1

Gaël Laurans'ın belirttiği gibi, çoklu karşılaştırma problemine giren istatistiksel analizler daha muhafazakar eşikler kullanma eğilimindedir. Bununla birlikte, özünde 0.05 kullanıyorlar, ancak test sayısı ile çarpılıyorlar. Bu prosedürün (Bonferroni düzeltmesi) hızla inanılmaz derecede küçük p değerlerine yol açabileceği açıktır. Bu yüzden geçmişte insanlar (sinirbilimde) p <0.001'de durdu. Günümüzde diğer çoklu karşılaştırma düzeltmeleri yöntemleri kullanılmaktadır (bakınız Markov rasgele alan teorisi).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.