İstatistikçiler niçin önemli olmayan bir sonuç, sıfır hipotezini kabul etmenin aksine “null'u reddedemezsiniz” anlamına gelir?


44

İki örnek t-testi gibi geleneksel istatistiksel testler de, iki bağımsız örneğin bir fonksiyonu arasında bir fark olmadığı hipotezini ortadan kaldırmaya çalışmaya odaklanır. Sonra, bir güven düzeyi seçeriz ve araçların farkı% 95 seviyesinin üzerindeyse, boş hipotezi reddedebileceğimizi söyleriz. Olmazsa, "boş hipotezi reddedemeyiz". Bu da kabul edemeyeceğimiz anlamına geliyor. Boş hipotezin doğru olup olmadığından emin olmadığımız anlamına mı geliyor?

Şimdi, hipotezimin iki örneğin bir fonksiyonunun aynı olduğu (bir hipotezin iki örneğin farklı olduğu geleneksel istatistik testlerinin tersi olduğu) bir test tasarlamak istiyorum. Böylece benim boş hipotezim, iki numunenin farklı olduğu anlamına geliyor. Böyle bir testi nasıl tasarlamalıyım? Eğer p-değeri% 5'ten az ise, anlamlı bir fark olmadığı hipotezini kabul edebileceğimizi söylemek kadar basit olacak mı?



ortalama farkı% 95 seviyesinin üstünde ise boş hipotezi reddedebiliriz. % 95 bir "seviye" değildir, burada 100 vakadan 95'inde (karşılaştırmalar), örneklem istatistiğindeki farklılık örnekleme dalgalanmalarından kaynaklanmaktadır. boş değerin alfa = .05'te kabul edildiği anlamına gelir. % 95 seviyesini söylemek doğru terim değildir.
Subhash C. Davar

Yanıtlar:


44

Geleneksel olarak, boş hipotez bir nokta değeridir. (Tipik olarak , ancak gerçekte herhangi bir puan değeri olabilir.) Alternatif hipotez, gerçek değerin boş değerden başka bir değer olduğudur . Sürekli bir değişken (ortalama bir fark gibi) null değerine süresiz olarak yakın olan ancak yine de oldukça eşit olmayan bir değer alabilir ve bu nedenle null hipotezini yanlış yapar, geleneksel null hipotezi kanıtlanamaz. 0

Boş hipotezinizin ve gözlemlediğiniz ortalama farkın olduğunu hayal edin . Boş hipotezin doğru olduğunu varsaymak mantıklı mı? Henüz bilmiyorsun; güven aralığımızın neye benzediğini bilmek faydalı olacaktır . Diyelim ki% 95 güven aralığınız . Şimdi, gerçek değerin olduğu sonucuna varmalı mıyız ? CI'nin çok geniş olması ve makul bir şekilde şüphelendirebileceğimiz, verilerimizle tutarlı olduğundan şüphelenebileceğimiz pek çok büyük sıfır olmayan değer olduğu için kendimi rahat hissetmem. Diyelim ki çok daha fazla veri topluyoruz ve şimdi gözlemlediğimiz ortalama fark , fakat% 95 CI0( - 4.99 , 5.01 ) 0 0.01 ( 0.005 , 0.015 )0.01(4.99, 5.01)00.01(0.005, 0.015). Gözlenen ortalama fark aynı kalmıştır (eğer gerçekten olsaydı şaşırtıcı olurdu), ancak güven aralığı artık boş değeri dışlar. Tabii ki, bu sadece bir düşünce deneyi, fakat temel fikirleri açıklığa kavuşturmalı. Gerçek değerin herhangi bir özel değer olduğunu asla kanıtlayamayız; biz sadece (muhtemelen) bunun bir puan değeri olduğunu ispatlayabiliriz. İstatistiksel hipotez testinde, p değerinin> 0,05 olması (ve% 95 CI'nin sıfır içermesi) , sıfır hipotezinin doğru olup olmadığından emin olmadığımız anlamına gelir .

Somut durumunuza gelince, alternatif hipotezin ortalama farkın ve sıfır hipotezinin sıfırdan başka bir şey olduğu bir test oluşturamazsınız . Bu, hipotez testinin mantığını ihlal ediyor. Sizin temel, bilimsel hipoteziniz olması tamamen makul, ancak bir hipotez testi durumunda alternatif hipoteziniz olamaz. 0

Ne yapabilirsin? Bu durumda, denklik testini kullanırsınız. (Bu konudaki konu başlıklarımızdan bazılarını etiketine tıklayarak okumak isteyebilirsiniz .) Tipik strateji iki taraflı test yaklaşımını kullanmaktır. Çok kısaca, gerçek ortalama farkının olabileceğini düşündüğünüz bir aralık seçersiniz.0tüm bakımlarınız için, gözlemlenen değerin bu aralığın üst sınırından daha az olup olmadığını belirlemek için tek taraflı bir test gerçekleştirin ve alt sınırdan daha büyük olup olmadığını görmek için başka bir tek taraflı test uygulayın. Bu testlerin her ikisi de önemliyse, gerçek değerin önemsediğiniz aralığın dışında olduğu hipotezini reddettiniz. Biri (veya her ikisi de) anlamlı değilse, gerçek değerin aralığın dışında olduğu hipotezini reddedemezsiniz.

Örneğin, aralığında bir şeyin sıfıra o kadar yakın olduğunu varsayalım ki, amaçlarınız için esas olarak sıfırla aynı olduğunu düşünüyorsunuz, bu yüzden bunu temel hipoteziniz olarak kullanırsınız. Şimdi yukarıda açıklanan ilk sonucu aldığınızı hayal edin. Her ne kadar bu aralıkta kalsa da, iki yönlü bir t-testindeki boş hipotezi reddedemezsiniz, bu yüzden boş hipotezi reddedemezsiniz. Öte yandan, yukarıda açıklanan ikinci sonucu aldığınızı hayal edin. Şimdi gözlemlenen değerin belirlenen aralık içinde olduğunu görüyorsunuz ve hem üst sınırdan daha düşük, hem de alt sınırdan daha büyük olduğu gösterilebilir, böylece boş değeri reddedebilirsiniz. (Her ikisini de reddedebileceğinizi unutmayın.0.01 0(0.02, 0.02)0.01hipotezin doğru bir değerdir , ve hipotezi dış aralığının gerçek değeri yalan , ilk kafa karıştıran gibi, ama hipotez testi mantığı ile tam bir uyum olabilir.) 0(0.02, 0.02)


1
"Geleneksel olarak, sıfır hipotezi bir nokta değeridir" - bazı durumlarda sıfır hipotezini nokta gibi yazmış olsak da, aslında bileşiktir . Bu nedenle, ilk paragrafınızdaki argümanın tek taraflı testler için ne anlama geldiğini merak ediyorum. ( - bildiğim kadarıyla - tek taraflı testler için bile "kabul " yazın, ilk paragrafın gerçek sebebini yakaladığından emin değilim "kabul .)H 0H0H0
Silverfish

1
@ Gümüş balık, paragraf ile biter: "geleneksel bir nokta boş hipotezi kanıtlanamaz". Ancak aynı sebepten dolayı tek taraflı testler için " kabul " . Ne zaman , gerçek olabilir , fakat keyfi yakın & böylece olmayan önemli. Gerçekten olduğunu göstermek istiyorsanız, tek taraflı testin yönünü çevirebilirsiniz. Burada bir problem görmüyorum. H 0 : δ 0 δ > 0 < 0H0H0:δ0δ>0<0
gung - Monica

1
Yazdıklarının yanlış olduğunu söylemiyorum ve iletişim kurmaya çalıştığın fikir olduğundan şüphelendim. Açıkçası, iki taraflı testin cevabınızın ilk iki paragrafında bir nokta hipotezi ile başa çıkmasının nedeni, söz konusu durum budur. Fakat cevabınız, neden genel olarak kabul merak eden biri tarafından tekrar , argümanınızın gerçekte sıfır hipotezlerinin ötesine uzandığı açık değildir. H0
Silverfish

4
"Gerçek değerin belirli bir puan değeri olduğunu asla ispatlayamayız; yalnızca (muhtemelen) bunun bir puan değeri olduğunu ispatlayamayız" argümanı belirli bir durumdur - ya CI'nin ortaya çıkması halinde (-0.015 , -0.005)? Ne kadar "kanıtladıysak" (kelimenin tam anlamıyla, "matematiksel anlamda" kanıtladığını kullanmadığını biliyorum - belki de "göster" veya "öner" in amaçlanan anlama daha yakın olduğunu biliyorum) ayrıca "kanıtlanmış" , yine de "kabul etmiyoruz"ö 0 lH 0 :δ0δ0H0:δ0
Silverfish

1
@Silverfish Son yorumunuzun iyi bir noktaya değdiğini düşünüyorum. Felsefi olarak, ile tek taraflı testin , matematiksel olarak neredeyse aynı olsalar bile , iki taraflı noktasıyla iki taraftan biraz farklı olduğunu . Boş noktası kabul etmek anlamsızdır; ancak karşı test etmek aslında bunlardan birini (veya kesin olmayan bir sonucu) kabul etmesine yol açabilir. Ayrıca tek taraflı test Bayesian perspektifinden daha mantıklı. Ayrıca bilimsel tahminin bir yönü olmalı. Sanırım tek taraflı testlerin yeterince takdir edilmediğini düşünmeye başladım. H 0 : δ = 0 δ > 0 δ < 0H0:δ<0H0:δ=0δ>0δ<0
amip diyor Reinstate Monica

28

Boş hipotezin bir madalyonun 2 başlı olduğu, yani kafaların olasılığı 1 olduğu durumu göz önünde bulundurun. Bu, her makul alfa değerinden daha büyük olan 1.0 değerinde bir p ile sonuçlanır. Bu, madalyonun 2 başlı olduğu anlamına mı geliyor? Olabilir, ama aynı zamanda adil bir para olabilir ve şansa bağlı olarak kafaları gördük (adil bir parayla zamanın% 50'si olur). Dolayısıyla, bu durumda yüksek p değeri gözlemlenen verilerin null ile mükemmel bir şekilde tutarlı olduğunu, ancak diğer olasılıklarla da tutarlı olduğunu söylüyor.

Tıpkı mahkemede "Suçsuz Değil" kararı gibi, davalının masum olduğu anlamına da gelebilir, çünkü sanığın suçlu olduğu ancak yeterli kanıt olmadığı için olabilir. Boş hipotezde de aynı şekilde reddedemeyiz, çünkü sıfır doğru olabilir veya yanlış olsa bile reddetmek için yeterli kanıtımız olmayabilir.


3
"Suçsuz değil" örneğini beğendim. Bir adım daha ileri giderek, geçmişte nasıl kullanılacağımızı bilmediğimiz ve bazı mahkumiyetlerin üstesinden gelmediğimizi bildiğimiz DNA kanıtlarına dayanarak davaları tekrar açmak, yeterli kanıtı elde etmek için ihtiyaç duyulan her şey için daha fazla veri eklemenin mükemmel bir örneğidir.
Thomas Speidel

7

Kanıt yokluğu, bir eksikliğin kanıtı değildir (bir Altman unvanı, BMJ üzerine Bland makalesi). P değerleri, bize yalnızca önemli olduklarını düşündüğümüzde bir eksiklik kanıtı verir. Aksi takdirde bize hiçbir şey söylemezler. Dolayısıyla, delil yokluğu. Başka bir deyişle: bilmiyoruz ve daha fazla veri yardımcı olabilir.


5

Boş hipotez, , genellikle varsaymanız için gereken nedenlerden biri olarak kabul edilir. Çoğu zaman, göstermek istediğiniz "mevcut bilgi durumu" dur. İstatistiki olarak olası değildir.H0

Hipotez testleri için yapılan normal kurulum tip I hatasını en aza indirmektir, yani doğru olsa bile , boş hipotezi alternatif lehine reddetme ihtimalini en aza indirir . İlk önce küçültmeyi seçtiğimiz hata budur, çünkü bu ortak bilgi gerçekten doğru olduğunda ortak bilgiyi alt etmek istemeyiz.H 0H1H0

Test her zaman olması gerektiğini gerekir.H0

Eğer iki numunemiz varsa aynı şekilde dağılmayı bekliyoruz, o zaman boş hipotezimiz numuneler aynı. Eğer (çılgınca) farklı olacağını umduğumuz iki örneğimiz varsa, boş hipotezimiz farklı olduklarıdır.


Ve eğer beklentimiz yoksa .. bilmediğimiz şey olabilir. Ayrıca, iki örneğin farklı olduğu hipotezini reddetmek istiyorsak, karar kuralı nasıl işe yarayacak?
ryu576

Beklentiniz yoksa, her iki hatanın her ikisini de küçük tutmak istersiniz, ancak bu her zaman mümkün değildir. Bunu yapmak için ekstra bir değişkene (örneğin artan numune büyüklüğü gibi) ihtiyacınız var.
SomeEE

2
Boş değeri reddedebildiğimiz, ancak ispatlayamayacağımız için, boş değer genellikle ispatlamak veya doğru olduğunu varsaymak istediklerimizin tam tersidir. Eğer bir fark olduğuna inanırsak, null bunu fark etmemek için hiçbir fark olmamalıdır.
Greg Snow,

@Greg Hangisinin gerçek olmasını istediğinizi biliyorsanız, muhtemelen normal olanı budur.
Bazı EE

1
“Beklediğiniz” ve “farklı oldukları”, niceliksel olmadıkları için hiçbir şekilde istatistiksel hipotez olamaz. Meselenin özüne iner: boş ve alternatif hipotezler arasındaki roldeki asimetri, boştaki altındaki test büyüklüğünün örneklem dağılımını, boşluğun altındaki etki büyüklüğüne göre parametreleştirme ihtiyacına göre belirler. alternatif hipotez. Aynı zamanda "Tip I hatasını en aza indiririz" durumu da söz konusu değildir: bu asla olmaz (en az her zaman 0'dır). Testler , Tip I ve II hata oranları arasında bir denge arar .
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.