Boş hipotezi reddetmek için 0,04993'lük bir p değeri yeterli mi?

Wilcoxon imzalı istatistiksel anlamlılık testinde, değeri üreten bazı verilerle . eşiği ile bu sonuç sıfır hipotezini reddetmek için yeterli midir , yoksa testin sonuçsuz olduğunu söylemek daha güvenlidir, çünkü p değerini 3 ondalık basamağa olur mu? $p$ $0.04993$ $p < 0.05$ $0.050$

hypothesis-testing statistical-significance p-value

— İslam El-Nabarawy
kaynak

0,04993 <0,05, bu yüzden daha düşük. İçgüdünüz, birkaç ondalık basamağa hiçbir P-değerine güvenilemeyeceğine iyidir, ancak program 0.05'ten az diyorsa, insanlar genellikle onu teslim edildiği gibi alır. Buradaki asıl sorun, sabit düzeyli önem testinin bir fetişini yapmaktır, böylece <0.05 "gerçek", "yayınlanabilir", "mutluluk nedeni" ve tersi "yanıltıcı", "yayınlanamaz", "sefalet" . İstatistiklerle ilgili en iyi giriş metinleri bunu bir dereceye kadar tartışmaktadır. İyi biri Freedman, Pisani, Purves, İstatistik . New York: WW Norton, herhangi bir baskı.

— Nick Cox

Eğer p değeri 0.051 ise kararınızın ne olacağını kendinize sormalısınız. 0.049 ise ne olur? Farklı kararlar verir misiniz? Neden?

— AlefSin

Yorumlarınız için teşekkür ederim. Bizim durumumuzda, verilerin yayınlanabilir olup olmadığını düşünmüyoruz, vb. Sadece bu sonucun istatistiksel önemi hakkında bir açıklama yapmayı düşünüyoruz ve ifademizin yanlış veya yanlış olmadığından emin olmak istiyoruz. .

— İslam El-Nabarawy

Raporlama P = 0.04993 akla gelen şeydir. Hakemlerin veya editörlerin yorumlarını tahmin etmek zor. Yuvarlamak istiyorsanız, tutarlı bir yuvarlama kuralı belirtmek her zaman iyi bir fikirdir ve yaygın olarak kabul edilebilir. Bazı insanlar 3 dp'ye yuvarlanır ve ayrıca bir çeşit yıldızlama kuralı kullanabilirler, bu nedenle 0,050 (3 dp) bildirme ve <0,05 olarak oynamalar tutarlıdır.

— Nick Cox

Bilmiyorum ... belki bir çift önyükleme yapmalı ve

değeri için bir güven aralığı hesaplamalıyız ! Dürüst olmak gerekirse, şunu bildirirdim: "Bulgular sınırda anlamlı,

." Bu noktada, saçları bölüyorsunuz ve herkes aniden yanlış pozitifin 1/20 olasılığının bilim çalıştırmak için tamamen keyfi bir yol olduğunu hatırlıyor.

p

$p$

0.049 < p < 0.050

$0.049 < p < 0.050$

— AdamO

Yanıtlar:

Burada iki sorun var:

1) Resmi bir hipotez testi yapıyorsanız (ve zaten kitabımda bir p-değerini alıntılamak kadar ileri gidiyorsanız), resmi ret kuralı nedir?

Test istatistiklerini kritik değerlerle karşılaştırırken, kritik değer ret bölgesindedir . Bu formalite her şey sürekli olduğunda çok önemli olmasa da, test istatistiğinin dağılımının ne zaman ayrık olduğu önemlidir.

Buna uygun olarak, p-değerleri ve önem seviyeleri karşılaştırılırken kural şöyledir:

ise reddet $p\leq\alpha$

Lütfen p değerinizi 0,05'e yuvarlamış olsanız bile, gerçekten de $p$ değeri tam olarak 0,05 , resmen reddetmeniz gerektiğini unutmayın .

2) 'p değerinin bize ne söylediği' açısından, bir p değerini 'null'a karşı kanıt' olarak yorumlayabileceğinizi varsayarsak (diyelim ki bu görüş biraz bölünmüştür), 0.0499 ve 0.0501 veriler hakkında farklı şeyler söylemek (etki boyutları neredeyse aynı olur).

$\alpha = 0.05$

— Glen_b-Monica'yı eski durumuna döndür
kaynak

Fakat yine de, null değerini reddetmemek için çok benzer argümanlar kullanabilirsiniz. 0.05 hakkında özel bir şey yok, eğer sınırınız olarak 0.06 seçtiyseniz, muhtemelen soruyu sormazsınız, ancak durum o kadar farklı olmazdı ... Bunun yerine, soruyorum: "gerçek- Bu sonucun yaşam anlamı? ". Örneğin, bu biyolojik bir deney olsaydı, spesifik sonucun biyolojik önemini ararım, p değerini olduğu gibi rapor eder ve daha çok biyoloji hakkında yorum yapardım.

— nico

@nico bu zaten öğemin (2) noktasıydı; (1) de resmi yaklaşıma aşırı bağımlılığa karşı olduğunu savunuyor

— Glen_b -Restate Monica

Teşekkürler Glen ve nico. Verilerin bu kısmı deneylerimize ikincil oldu, bu yüzden değeri olduğu gibi rapor ettik. Her durumda, bunu kabul edilen cevap olarak işaretliyorum. Cevaplara veya yorumlara katılan herkese tekrar teşekkürler.

— İslam El-Nabarawy

Seyircinin gözünde yatar.

$\alpha$ $\alpha=0.05$ , birçok uygulayıcının İstatistikten sonra yaptıkları101).

Bu yüzden AlefSin'in daha önce yorumladığı şeye bağlı. Sorunuza "doğru bir cevap" olamaz. Elinizde ne olduğunu, yuvarlak olup olmadığını bildirin.

"Önemin önemi" konusunda büyük bir literatür vardır; örneğin, önde gelen Alman istatistikçi Walter Krämer'in "İstatistiksel önem kültü - Ekonomistlerin verilerini konuşturmak için ne yapması ve yapmaması gerektiği" konulu son makalesine bakın, Schmollers Jahrbuch 131 , 455-468, 2011.

— Skullduggery
kaynak

-6

$p=0.05$

Önemli bir sorun bu ifade şudur: "Biz rastladım ... bazı verileri".

$p$ $p$

Bu tür istatistiksel kötüye kullanım için bir isim var: veri tarama . Makalede ilginç bir hipotez olarak bildirme konusunda kararsızım; beklemeniz gereken fiziksel bir nedeni var mı?

Bununla birlikte, bir çıkış yolu var. Belki de karar önsel sadece bu gerçekleştirmek için tek sadece bu konuda testi one veri seti. Bunu daha sonra kanıtlayabilmeniz için laboratuvar not defterinize, birinin önünde yazdınız. Sonra testini yaptın.

Bunu yaptıysanız, sonucunuz $p=0.05$ ve benim gibi şüphecilere yedekleyebilirsiniz. Aksi halde, üzgünüm, istatistiksel olarak anlamlı bir sonuç değildir.

— Mike McCoy
kaynak

Bu, belirli bir ifade seçimine aşırı güveniyor olabilir; sadece kötü bir kelime seçimi olabileceğinden çok şey varsayıyorsunuz - buradaki herkesin ilk dil olarak İngilizce'si yok. Potansiyel bir sorun olarak ortaya çıkarmaya kesinlikle değer, ancak şeyleri bu kadar kel ("kesinlikle değil") belirtmek, burada ne olduğunu söyleyebileceğimizden daha fazlasını bildiğiniz anlamına gelir. (Dahası, bir 'laboratuvar not defteri' referansı OP'nin laboratuarda çalıştığını ima ediyor.

— Durumdan şüphe duyuyorum

Mike McCoy, cevabınız için teşekkür ederim, ama korkarım ki Glen_b doğru. Ben anadili İngilizce değilim ve becerilerimin izin verdiği kadar akıcı bir şekilde yazmaya ve konuşmaya çalışırken, kullanım ve çağrışım beni atlatmaya devam ediyor. Dolayısıyla, bu özel durumda, önemli bir şey bulana kadar farklı şeyler denemedik. Aslında, kanıtlamaya çalıştığımız şey, bazı hata değerlerinde istatistiksel olarak anlamlı bir artış olmadığı ve belirli bir durumda hatanın gerçekten azaldığını bulduk ve W testini çalıştırdığımızda, bu 0.0499'u aldık .

— İslam El-Nabarawy

Mike, ayrıca sorunun ifadesinde bir sorun görmedim. Ve burada hiç kimse veri gözetleme, madencilik, tarama, burada ne olursa olsun görmedi ... Ve kesinlikle izleyicinin gözünde yatıyor. Matematiksel bir gerçek yoktur, ancak istatistikçi tarafından seçilen bir karar kuralı vardır. AlefSin, Glen'in (2) konusunu tekrar okudum ve yazdım.

— Skullduggery

@ IslamEl-Nabarawy Eşdeğerlik / fark eksikliği oluşturmak istiyorsanız, eşik değerine veya potansiyel veri gözetlemesine yakın bir değeri nasıl yorumlayacağınızdan başka pek çok probleminiz var. Sadece .05 (veya seçtiğiniz hata seviyesi ne olursa olsun) üzerinde bir p değeri bulmak kesinlikle yeterli değildir. Burada ve başka yerlerde “denklik testi” konusuna bakın veya bu konuda özellikle bir soru sorun, çünkü bu tamamen farklı bir sorundur.

— Gala

"Ancak, bir çıkış yolu var. Belki de sadece bu tek bir veri seti üzerinde sadece bu bir testi yapmaya önsel karar verdiniz. Bunu daha sonra kanıtlayabilmeniz için laboratuvar not defterinize, birinin önüne yazdınız. Eğer bunu yaptıysanız, sonuç p = 0.05 düzeyinde geçerlidir ve benim gibi şüphecilere yedekleyebilirsiniz. Aksi halde, üzgünüm, istatistiksel olarak anlamlı bir sonuç değildir " Kanıtlanmış olana kadar suçlu hakkında konuşun masum. Yani, akademik sahtekârlığı dışlayan adli kanıtların yokluğunda, bir analiz değersiz mi? Sheesh.

— GoF_Logistic