Anlamlı olmayan bir etki etrafındaki dar bir güven aralığı null için kanıt sağlayabilir mi?


9

Null değerinin reddedilmesinin null değerinin doğru olduğunu ima ettiği açıktır. Ama bir durumda sıfır red edilmez ve ilgili güven aralığı (CI) dar olup, bu kanıt sağlamaz etrafında 0 merkezli nerede için boş?

İki fikrim var: Evet, pratikte bu, etkinin az ya da çok olduğuna dair kanıt sağlayacaktır. Bununla birlikte, katı bir hipotez testi çerçevesinde, sıfır etkilerin, karşılık gelen CI'ları gibi, çıkarım için basitçe kullanılamaz olduğu görülmektedir. Peki puan tahmini anlamlı olmadığında bir CI'nin anlamı nedir? Çıkarım için de kullanılamaz mıdır yoksa önceki örnekte olduğu gibi null için kanıtları ölçmek için kullanılabilir mi?

Bilimsel referansları olan cevaplar teşvik edilmektedir.


Muhtemelen denklik testi ve siteyi detaylandıran sorularla ilgileneceksiniz . Bkz . Grup farkı olmayan hipotezler nasıl test edilir? bir örnek için.
Andy W

1
Başka bir şeyin alternatifine karşı boş bir noktaya dair kanıt demek istiyorsan ... o zaman hayır. Gözlenen çok küçük değer ile null arasındaki sayılamayacak kadar sonsuz sayıda alternatif hala null değerinden daha olası olacaktır. Başka bir şey kastediyorsanız, belki de bazı durumlarda.
Glen_b

Evet, o zaman, daha önce duymadığım bir terim olan eşdeğer bir test meselesi olurdu.
ATJ

Yanıtlar:


6

Kısacası: Evet.

Andy W'nin yazdığı gibi, parametrenin belirli bir değere eşit olduğu sonucuna varmak (sizin durumunuzda, etki büyüklüğü sıfıra eşittir) bir denklik testi meselesidir.

Sizin durumunuzda, bu dar güven aralığı aslında etkinin pratik olarak sıfır olduğunu gösterebilir, yani eşdeğerliğin sıfır hipotezi reddedilebilir. seviyesindeki önemli eşdeğerlik tipik olarak , önceden belirlenmiş bir eşdeğerlik aralığı içinde yer alan sıradan bir güven aralığı ile gösterilir . Bu denklik aralığı, gerçekten küçük sapmaları ihmal edebileceğinizi dikkate alır, yani bu denklik aralığı içindeki tüm efekt boyutlarının pratik olarak eşdeğer olduğu düşünülebilir. (Eşitliğin istatistiksel testi mümkün değildir.)1-α1-2α

Bu konudaki en kapsamlı kitap olan Stefan Wellek'in "Eşdeğerlik ve Yetersizlik İstatistiksel Hipotezlerini Test Etme" bölümüne bakınız.


2

Boş hipotezler, "Tüm modeller yanlış, ancak bazıları faydalıdır." Kelimenin tam anlamıyla ve bağlam dışına alınmazlarsa muhtemelen en yararlıdırlar - yani, sıfırın epistemik amacını hatırlamak önemlidir. Eğer amaçlanan hedef olan tahrif edilebiliyorsa, alternatif, yine de oldukça bilgilendirici olmasa da, karşılaştırma yoluyla daha yararlı hale gelir. Null değerini reddederseniz, etkinin muhtemelen sıfır olmadığını (ya da null hipotezleri sahtecilik için diğer değerleri de belirtebileceğini) söylüyorsunuz ... o zaman ne olacak?

Hesapladığınız etki büyüklüğü, nüfus parametresi için en iyi puan tahmininizdir. Genel olarak, aşırı ya da küçümseme şansı eşit derecede iyi olmalıdır, ancak @ Glen_b'in yorumunda da belirtildiği gibi, ölü merkez boğa gözü olma şansı sonsuzdur. Kaderin bazı tuhaf büküm tarafından (veya inşaat tarafından? - Ya arada, biz varsayımsal konuşuyorum varsayılmaktadır) sizin tahmin doğrudan düşer , bu parametre farklı bir değer dahilinde olmadığını çok kanıt hala değil güven aralığı. Güven aralığının anlamı, konumu ve genişliği ilgili bir şekilde değiştirebildiği sürece, herhangi bir hipotez testinin önemine bağlı olarak değişmez.0.0¯

Sıfır hipotezi tam anlamıyla doğru olan (veya henüz görmediyseniz ve biraz istatistiksel eğlence için buradaysanız) (simüle edilmiş) popülasyondan örnekler için etki büyüklüğü tahminlerinin nasıl göründüğüne aşina değilseniz ), Geoff Cumming'in Değerleri Dansı'na bakınp . Bu güven aralıklarının zevkinize göre yeterince dar olmaması durumunda, R'de kendimden bazılarını, her biri den utangaç rastgele örnekleri kullanarak simüle etmeyi denedim . Bir tohum ayarlamayı unuttum, ama ayarladım ve sonra bu cevabı bitirmeden önce baktığım kadar çok koştum , bu da bana 6000 numune verdi. İşte histogram ve kullanan bir yoğunluk arsa ven=1MN-(0,1)x=c()x=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))hist(x,n=length(x)/100)plot(density(x)), sırasıyla:

    

Beklendiği gibi, kelimenin tam anlamıyla sıfır etkisi olan bir popülasyonun bu rastgele örneklerinden kaynaklanan çeşitli sıfır olmayan etkilere dair kanıtlar vardır ve bu tahminler, normal parametre etrafında aşağı yukarı normal olarak dağıtılır ( skew(x)= -.005, kurtosis(x)= 2.85). Tahmininizin değerini sadece gerçek parametre değil, örneğinden bildiğinizi düşünün : parametrenin neden tahmin yerine sıfırdan daha yakın olmasını beklersiniz? Güven aralığınız null değeri içerebilir, ancak null, ters yönde örnek efekt büyüklüğünüzden eşdeğer mesafenin değerinden gerçekten daha makul değildir ve diğer değerler bundan daha makul olabilir, özellikle nokta tahmininiz!n=1M

Pratikte, bir efektin az ya da çok sıfır olduğunu göstermek istiyorsanız, ne kadar az ya da çok yok saymaya meyilli olduğunuzu tanımlamanız gerekir. Simüle ettiğim bu büyük örneklerle, ürettiğim en büyük büyüklük tahmini . Daha gerçekçi numuneleri ile numuneleri arasında bulduğum en büyük örnek . Yine, artıklar normal olarak dağıtılır, bu yüzden bunlar olası değildir, ancak asıl mesele mantıksız değildir.|r|=0,004n=9991M|r|=0,14

Bir CI, çıkarım için muhtemelen genel olarak bir NHST'den daha yararlıdır. Sadece parametrenin ihmal edilebilir derecede küçük olduğunu varsaymanın ne kadar kötü olabileceğini göstermez; parametrenin gerçekte ne olduğu hakkında iyi bir fikri temsil eder. Bunun ihmal edilebilir olup olmadığına hala karar verilebilir, ancak bunun ne kadar ihmal edilemez olabileceğine dair bir fikir edinilebilir. Güven aralıklarının daha fazla savunulması için, bkz. Cumming (2014 , 2013) .

Kaynaklar
- Cumming, G. (2013). Yeni istatistikleri anlama: Etki boyutları, güven aralıkları ve meta analiz . Routledge.
- Cumming, G. (2014). Yeni istatistikler: Neden ve nasıl. Psikolojik Bilimler, 25 (7), 7-29. Http://pss.sagepub.com/content/25/1/7.full.pdf+html adresinden erişildi .


Teşekkürler, Cumming'in çalışmalarına çok aşinayım. Ben "? Nokta tahmini, ardından CI'lar çıkarım için kullanılabilecek anlamsız olduğunu ES if (Ya da 'sıfır' yani, nokta tahmini olarak işe yaramaz)", sorum daha çizgisinde oldu varsayalım
ATJ

1
@ATJ: Bir parametre için nokta tahmini veya ( ) güven aralıkları sıfırdan (seviyede) önemli ölçüde farklı olmadığında "işe yaramaz" hale gelmez1-αα) veya sıfıra sahiptir.
Scortchi

@ATJ: Dediğim gibi, bir CI'nin anlamı [/ faydası] herhangi bir NHST'nin önemine bağlı olarak değişmez. CI, çıkarım için muhtemelen genel olarak bir NHST'den daha yararlıdır ... parametrenin gerçekte ne olduğu hakkında iyi bir fikri temsil eder. Örneğin, yeni koştum cor.test(rnorm(9999999),rnorm(9999999))ve bir CI aldım{-0.00063,0,00060}. Bu nedenle, tekrar çalıştırdığımda, bu aralıkta yeni bir tahmin elde etme olasılığım% 95'tir. Tekrar çalıştırıyorum, tahminimr=0,00029; CI tabanlı çıkarım haklıydı! Null inşaat ile olur, ancak kanıtlarım bunun yerine tahminimi tercih eder ...
Nick Stauner
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.