Büyük bir çalışmada boş hipotezi reddedemezsek, boş değeri kanıtlamaz mı?


59

Boş hipotez anlamlılık testinin temel bir sınırlaması, bir araştırmacının boş lehine delil toplamasına izin vermemesidir ( Kaynak ).

Bu iddianın birçok yerde tekrarlandığını görüyorum, ancak bunun için gerekçe bulamıyorum. Biz büyük bir çalışma gerçekleştirmek ve biz ise sıfır hipotezinin karşı istatistiksel olarak anlamlı bir kanıt bulmuyorum , o kanıt değildir için boş hipotezi?


3
Fakat boş hipotezin doğru olduğunu varsayarak analizimize başlıyoruz ... Varsayım yanlış olabilir. Belki de yeterli gücümüz yok ama bu, varsayımın doğru olduğu anlamına gelmiyor.
SmallChess

13
Eğer okumadıysanız, Jacob Cohen'in Dünya'nın Yuvarlak olduğunu tavsiye ederim (p <.05) . Yeterince büyük bir örneklem büyüklüğü ile herhangi bir boş hipotezi hemen hemen reddedebileceğinizi vurguluyor. Ayrıca etki büyüklüklerini ve güven aralıklarını kullanmaktan yana konuşuyor ve Bayesian yöntemlerinin düzgün bir sunumunu sunuyor. Artı, okumak için saf bir zevk!
Dominic Comtois

7
Boş hipotezler sadece yanlış olabilir. ... boş değeri reddetmemesi, yeterince yakın bir alternatife karşı kanıt değildir.
Glen_b

3
Bkz stats.stackexchange.com/questions/85903 . Ancak bkz . Stats.stackexchange.com/questions/125541 . "Büyük bir çalışma" gerçekleştirerek Eğer demek, sonra reddetme başarısızlık "yeterince büyük ilgi minimal etkisi tespit etmek için yüksek güce sahip" olabilir null adlı kabul olarak yorumlanabilir.
amip diyor Reinstate Monica,

7
Hempel'in onay paradoksunu düşünün. Bir kargayı incelemek ve siyah olduğunu görmek “tüm kargalar siyah” için destek. Ancak, siyah olmayan bir nesneyi mantıksal olarak incelemek ve bunun bir karga olmadığını görmek, "tüm kargalar siyah" ve "tüm siyah olmayan nesneler karga değil" ifadelerinin mantıksal olarak eşdeğeri olduğundan önerisini desteklemelidir ... çözüm, siyah olmayan nesnelerin sayısının karga sayısından çok daha fazla olmasıdır, bu nedenle siyah bir karga'nın önerisine verdiği destek, siyah olmayan bir karganın sağladığı minik destekten daha büyüktür.
Ben

Yanıtlar:


63

Boş bir hipotezi reddetmekte başarısız olmak, boş hipotezin doğru olduğunun kanıtıdır, ancak özellikle iyi bir kanıt olmayabilir ve kesinlikle boş hipotezi kanıtlamaz .

Kısa bir yoldan gidelim. Bir an için eski klişe düşünün:

Kanıt bulunmaması, eksikliğin kanıtı değildir.

Popülerliğine rağmen, bu ifade saçma. Bir şey ararsanız ve onu bulamazsanız, bu kesinlikle orada olmadığının bir kanıtıdır. Bu kanıtın ne kadar iyi olduğu, aramanızın ne kadar kapsamlı olduğuna bağlıdır. Bir araştırma araştırması, zayıf kanıtlar sunar; ayrıntılı bir araştırma güçlü kanıtlar sunar.

Şimdi, hipotez testine geri dönelim. Bir hipotez testi yaptığınızda, boş hipotezin doğru olmadığına dair kanıtlar ararsınız. Bunu bulamazsanız, o zaman kesinlikle sıfır hipotezi de kanıtlanmıştır olan gerçek, ama bu deliller ne kadar güçlü? Bunu bilmek için, boş hipotezi reddetmenize neden olacak kanıtların aramanızı engellemesinin ne kadar muhtemel olduğunu bilmek zorundasınız. Yani, testinizde yanlış bir negatif ihtimal var mı? Bu, testin gücü, (özellikle, tamamlayıcı, 1- .ββ

Şimdi, testin gücü ve bu nedenle yanlış negatif oran, genellikle aradığınız etkinin boyutuna bağlıdır. Büyük efektlerin tespit edilmesi küçük olanlardan daha kolaydır. Bu nedenle, bir deney için tek bir yok ve bu nedenle boş hipotez için kanıtların ne kadar güçlü olduğu sorusuna kesin bir cevap yok. Başka bir deyişle, her zaman olduğu bazı o deney tarafından ekarte değil o kadar küçük etki boyutu.β

Buradan devam etmek için iki yol var. Bazen bazı eşik değerlerden daha küçük bir efekt boyutuyla ilgilenmediğinizi biliyorsunuzdur. Bu durumda, denemenizi muhtemelen boş hipotezin etkinin eşik değerin üstünde olduğu şekilde yeniden denemelisiniz ve sonra etkinin eşiğin altında olduğu alternatif hipotezini test edin. Alternatif olarak, sonuçlarınızı etkinin inanılır boyutuna sınırlar koymak için kullanabilirsiniz. Sonucunuz, etkinin büyüklüğünün, bazı olasılıklarla birlikte belirli aralıklarla yattığı olacaktır. Bu yaklaşım, kendinizi böyle bir durumda sık sık bulursanız, hakkında daha fazla bilgi edinmek isteyebileceğiniz bir Bayesian tedavisinden sadece küçük bir adımdır.

İlgili bulabileceğiniz bir soruya, yararlı bulabileceğiniz devamsızlık testinin kanıtlarına değinen güzel bir cevap var .


9
, ve anlamlı olmayan bir p değeri olan bir hipotez testi . Sebepinize göre, bu için bir kanıt . , ve anlamlı olmayan bir p-değeri olan başka bir hipotez testi daha sonra için bazı kanıtlar sağlayacaktır . Bu deliller açıkça çelişkilidir. H1:μ>2x¯=3μ2H1:μ<4x¯=3μ4
Macond

4
Argümanı takip ettiğimden emin değilim. Her biri karşılıklı olarak tutarsız iki hipotezden biri için kanıtlar (muhtemelen oldukça zayıf) sağlayan iki deney tanımladığımı söyleyebileceğimden. Bu neden şaşırtıcı?
Hiç kimse

8
Başka bir örnek: ortak . Eğer delil olduğuna sen onu demek reddetmek için başarısız olursa, gerçek satırda diğer tüm değerleri arasında, gerçek ortalama o olduğunu tam olarak 0 ..? Bu cevap yanıltıcıdır! H0:μ=0
Tim

3
Kanıt hesabınızı beğendim - verilerin bir modelden diğerine olan desteğini ölçmek için hızlı bir şekilde Bayes faktörüne yol açıyor gibi görünüyor. Mu ya da karşı ifade vermek ? Peki için önceki yoğunluğuna bağlıdır : Eğer düşünüyorsanız 'ın ya bir yerlerde sadece 2 yaşın altındaki ya da bir yere çok daha yüksek 3'ten, veri bunun için kanıt; Eğer düşünüyorsanız s -10 & 10 arasında herhangi bir yerde olması eşit olasılıkla, veri buna karşı kanıt'. Ancak, sıklıkla yapılan bir analizde, inanç dereceniz bir sayı ile temsil edilmez, bu nedenle hangi kanıt kavramı geçerlidir? μ2μμμx¯=3μ2μμμ
Scortchi - Monica'yı yeniden kur

6
Bana Riemann hipotezini hatırlatıyor. Aradık ve çizginin dışındaki önemsiz sıfırları 1/2 ile gerçek parçalara ayırdık, ancak hiçbiri bulamadık. Ve Riemann hipotezini doğru görmezken, ispatlayamadığımız için çoğu matematikçi bunun doğru olduğuna inanır ve Riemann hipotezinin doğru olduğu koşullu olarak doğru olan birçok sonuç vardır. :) Bu durumda yorumladık. yokluğun kanıtı olarak delil yokluğu
Ant

29

NHST bize p-değerlerine güveniyor: Bize söyleyelim: Boş hipotezi doğruysa, verilerimizi gözlemleme olasılığımız nedir (veya daha fazla aşırı veri)?

Boş hipotezin doğru olduğunu varsayıyoruz - boş hipotezin% 100 doğru olduğu NHST'de yapıldı. Küçük p değerleri bize, eğer boş hipotez doğruysa, verilerimizin (veya daha fazla aşırı verinin) muhtemel olmadığını söyler.

Fakat büyük bir p değeri bize ne söylüyor? Bize, boş hipotez verildiğinde verilerimizin (veya daha fazla aşırı verinin) muhtemel olduğunu söyler.

Genel olarak, P (A | B) ≠ P (B | A).

Boş hipotezi için kanıt olarak büyük bir p-değeri almak istediğinizi düşünün. Bu mantığa güvenirsiniz:

  • Eğer boş ise, o zaman yüksek bir p-değeri muhtemeldir. ( Güncelleme: Doğru değil. Aşağıdaki yorumlara bakınız. )
  • Yüksek bir p değeri bulunur.
  • Bu nedenle boş değer geçerlidir.

Bu daha genel bir şekilde gerçekleşir:

  • Eğer B doğruysa, A muhtemeldir.
  • Bir oluşur.
  • Bu nedenle, B doğrudur.

Bununla birlikte, bir örnek tarafından görülebileceği gibi, bu yanlış.

  • Dışarıda yağmur yağarsa, zemin ıslak olabilir.
  • Zemin ıslak.
  • Bu nedenle, dışarıda yağmur yağdı.

Yer çok iyi ıslak olabilir çünkü yağmur yağdı. Veya bir fıskiye, bir oluklarını temizleyen biri, bir su ana kırdı, vb. Olabilir. Yukarıdaki bağlantıda daha aşırı örnekler bulunabilir.

Kavraması çok zor bir kavram. Boş değer için kanıt istiyorsak, Bayesci çıkarım gereklidir. Bana göre, bu mantığın en erişilebilir açıklaması Rouder ve ark. (2016). Gazetede Çıkarımda Ücretsiz Bir Öğle Yemeği Var mı? Bilişsel Bilimler Alanlarında yayınlanan , 8, s. 520–547.


3
Tüm örneklerinizin "X doğrudur" sonucunu vermesinden hoşlanmıyorum. Bir şeyi kanıtlamak,% 100 kesinliğe sahip bir şeyi sonuçlandırmakla aynı şey değildir. Dışarı çıkarsam ve zemin ıslaksa, bu "yağmur yağdı" nın kanıtıdır. Bu kanıt, yağmurun oluşma ihtimalini çok daha fazla arttırıyor.
Atte Juvonen

Bu adil. Bu Rouder ve diğ. Cevabımın sonunda bağladığım makale kesin sonuçlara sahip örnekler içermiyor.
Mark White,

6
@AtteJuvonen evet, yağmur için bazı kanıtlarımız var , ancak bunun ne kadar muhtemel olduğunu bilmiyoruz, bu nedenle yapabileceğiniz tek sonuç "yağmur yağabileceği veya zemini ıslatan başka bir şey olabileceği" sonucudur . Demek sonuçsuz kanıtların var. Sadece Bayesian istatistiklerine dayanarak zıt argümanı yapabilirsiniz.
Tim

3
"Sıfır için delil istiyorsak Bayesian çıkarımı gereklidir"; Atıfta bulunduğunuz çalışma, Bayesian istatistiğinin oldukça vokal ve sert bir savunucusu olan Wagenmakers'dan geliyor. Fakat gerçekte sık sık paradigmada "sıfır için" kolayca kanıt bulunabilir, örneğin denklik için TOST (iki tek taraflı test). (cc @ AtteJuvonen).
amip diyor Reinstate Monica,

10
"Eğer boş ise, o zaman yüksek bir p-değeri muhtemeldir." - bu doğru değil. Eğer boş hipotez doğruysa, o zamanpU[0,1] , bu yüzden yüksek değerleri boş hipotezin altındakilerden daha düşük değildir. Söyleyebileceğiniz tek şey, yüksek bir değerinin boş altında diğer hipotezlere göre daha muhtemel olmasıdır - ancak hipotezler ya tutar ya da yoktur, bu nedenle hipotezler, içinde faaliyet gösterdiğimiz olasılık alanı değildir. Bayes paradigmasında çalışmadığımız sürece! Ve bu, tartışmanızın maalesef bozulduğu yer. ppp
S. Kolassa - Monica

14

Varsayım ile ilgili neyin yanlış olduğunu anlamak için aşağıdaki örneğe bakın:

Hayvanat bahçesindeki bir çevreyi sakinlerini göremediğiniz bir yer hayal edin. Maymunların yaşadığı hipotezini kafese bir muz koyarak ve test edip ertesi gün geçip geçmediğini kontrol etmek istiyorsunuz. Bu, artan istatistiksel anlamlılık için N kez tekrarlanır.

Şimdi boş bir hipotez oluşturabilirsiniz: Kasada maymunlar olduğu göz önüne alındığında, muzları bulup yiyebilecekleri çok muhtemeldir, bu nedenle muzlara her gün dokunulmazsa, içeride herhangi bir maymunun bulunması çok olası değildir.

Ama şimdi muzların her gün (neredeyse) gittiğini görüyorsunuz. Bu sana maymunların içeride olduğunu mu söylüyor?

Tabii ki değil, çünkü muz gibi başka hayvanlar da var, ya da belki bazı özenli hayvanat bahçesi her akşam muzu temizliyor.

Öyleyse bu mantıkta yapılan hata nedir? Mesele şu ki, içeride maymun yoksa, muzların gitme olasılığı hakkında hiçbir şey bilmiyorsunuzdur. Boş hipotezi doğrulamak için, boş hipotezi yanlışsa kaybolan muzların olma olasılığı küçük olmalıdır, ancak bunun olması gerekmez. Aslında, eğer boş hipotez yanlışsa, olay eşit derecede muhtemel (veya daha da muhtemel) olabilir.

Bu olasılığı bilmeden boş hipotezin geçerliliği hakkında hiçbir şey söyleyemezsiniz. Mantarlar her akşam tüm muzları çıkarırsa, ilk bakışta sıfır hipotezini desteklediğiniz görülse de, deney tamamen değersizdir.


Bu kabul edilen cevap olmalı.
Emily L.

2
@ amoeba Bu durumda, boş hip, maymunların kafeste olduğu anlamına gelir. Alt hip, kafeste hiç maymun olmamasıdır. Topladığım örnekler, her sabah "muz gitti" ve "hala muz var" gözlemleri. Maymunlar ve muz bulma yetenekleri hakkında birkaç varsayım yaparak, asıl sonucu bir kafes içinde maymunlarla görme ihtimalimi hesaplayabilirim. Eğer muzlar hala sık sık oradaysa, boş hip'i reddedeceğim. Eğer muzlar her zaman bittiyse, bu boş hipe uyuyor, ama maymunların kafeste olduğunu kanıtlamaz.
Thern

1
@ amoeba Maymun örneğini doğrudan t testi senaryosuna çevirmenin mümkün olup olmadığından emin değilim. Bildiğim kadarıyla, null hipotez testi genellikle Mark White'ın cevabında yazdığı şeyi de ifade eder: "Null hipotezi doğruysa, verilerimizi (veya daha aşırı veri) gözlemleme olasılığımız nedir?". T testi senaryonuz bunun özel bir durumudur, ancak şu anda bu senaryonun nasıl genelleştirilebileceğini görmüyorum. İçimden gelen hislerime göre, senaryonuzun ve maymun örneğinizin doğrudan birbiriyle eşlenemeyen iki farklı hipotez testi yöntemi olduğunu söyleyebilirim.
Thern

1
Öyleyse @ Nebr, o zaman yine maymun örneğinizin anlamı konusunda kafam çok karıştı. T-testi muhtemelen en yaygın hipotez testidir; Yorumumda bahsetmiştim çünkü bu tipik bir test örneği. Eğer maymun örneğiniz (dediğiniz gibi) buna uygun değilse - tipik! - durum, o zaman anlamı hakkında şaşkınım. Aslında, t testi ve maymun örneğinin "iki farklı hipotez testi yöntemi" olduğunu söylerseniz, maymun örneğinizi "yol" u takip eden bir istatistiksel test örneği verebilir misiniz? Maymun örneğiniz tam olarak neye benziyor?
amip diyor Reinstate Monica,

1
@Nebr Bunun genel bir soru olduğu konusunda hemfikirim. Bana bir veremezsin Ama eğer tek maymun örneğindeki aynı özelliği olurdu gerçek istatistiksel testin örneğini, o zaman ben üzgünüm ama ben çok fazla alakasız Bu konuya ilişkin maymun örneği dikkate almak gerekir. Maymun örneğinin t testi ile özel olarak uyuşması gerektiğini söylemiyorum. Ama bir şeye tekabül etmesi gerekiyor !
Amip Reinstate Monica

14

En Çok Yayınlanan Araştırma Bulgularının Neden Yanlış Olduğu adlı ünlü makalesinde , Ioannidis, Bayesian muhakemesini ve temel bulguların yanlış olduğunu, çoğu bulguların yanlış-pozitif olduğunu iddia ediyordu. Kısaca, belirli bir araştırma hipotezinin gerçek olabileceği çalışma sonrası olasılık - diğer şeylerin yanı sıra - söz konusu hipotezin çalışma öncesi olasılığına (yani temel orana) bağlıdır.

Bir cevap olarak, Moonesinghe ve ark. (2007) , aynı çerçeveyi, replikasyonun bir hipotezin gerçek olabileceğini çalışma sonrası olasılığını büyük ölçüde arttırdığını göstermek için kullandı. Bu mantıklı: Eğer çoklu çalışmalar belirli bir bulguyu çoğaltabilirse, varsayımsal hipotezin doğru olduğundan daha eminiz.

Moonesinghe ve ark. (2007), bulguyu çoğaltmada başarısızlık durumunda çalışma sonrası olasılığını gösteren bir grafik oluşturmak için. Belirli bir araştırma hipotezinin çalışma öncesi% 50 gerçek olma ihtimalinin olduğunu varsayalım. Ayrıca, tüm çalışmaların hiçbir önyargıya sahip olmadığını (gerçekçi değil!)% 80 gücüne sahip olduğunu ve 0,05 kullandığını farz ediyorum .αÇalışma sonrası olasılık

Grafik, 10 çalışmadan en az birinin önemine ulaşamadığı takdirde, çalışma sonrası hipotezin doğru olma olasılığımızın neredeyse 0 olduğunu göstermektedir. Aynı ilişkiler daha fazla çalışma için de geçerlidir. Bu bulgu aynı zamanda sezgisel bir anlam ifade eder: Bir etkinin bulunmasındaki tekrarlanan bir başarısızlık, etkinin büyük olasılıkla yanlış olduğu inancımızı güçlendirir. Bu akıl yürütme, @RPL tarafından kabul edilen cevap ile paraleldir.

İkinci bir senaryo olarak, çalışmaların sadece% 50'lik bir güce sahip olduğunu varsayalım (tümü eşit).Çalışma sonrası olasılık

Şimdi çalışma sonrası olasılığımız daha yavaş azalıyor, çünkü her çalışma gerçekten varsa, etkiyi bulmak için yalnızca düşük güce sahipti.


Bir testin bu hipotezi başarısız olduğu durumlarda, sıfır hipotezi ile ilgili tüm kanıtları aldığınızı unutmayın. Ancak OP'den gelen varsayımlar, testlerin sıfır hipotezini desteklediğiydi ("Büyük bir çalışma yaparsak ve sıfır hipotezine karşı istatistiksel olarak anlamlı kanıt bulamazsak, bu sıfır hipotezi için kanıt değil midir?"). Bu, diyagramlarınızın en solundaki bölüme ve dolayısıyla etkinin olasılığının hala% 50 (veya genel olarak çalışma öncesi olasılık) olduğu bir duruma karşılık gelir, bu nedenle hiçbir şey elde edemezsiniz.
Thern

@Nebr anlamıyorum. 1 büyük, iyi çalışan bir çalışma yaparsak (% 95 güç) ve boş hipoteze karşı kanıt bulamazsak (örneğin, bir istatistiksel hipotez testi% 5 düzeyinde anlamlı değildir), çalışma sonrası olasılığımız olacaktır. Söz konusu çerçevede 0,05 olması (% 50 çalışma öncesi olasılık ile).
COOLSerdash

1
@Nebr Son yorumunuz bir anlam ifade etmiyor: sonuç anlamlı değilse, muhtemelen "yanlış pozitif" olamaz.
amip diyor Reinstate Monica

1
@Nebr If you have a negative, you found evidence against the null- Ne? "Negatif" kelimesinin tam tersi bir anlamı vardır. Önemli bir p değerine "pozitif" sonuç denir; anlamlı olmayan bir "negatif" dir.
amip diyor Reinstate Monica

1
@Nebr% 100 güç, "H0 doğruysa, her zaman H1'i göreceğimizden emin olabileceğimiz" anlamına gelmez. Bu, eğer H1 doğruysa, H1'i her zaman göreceğimiz anlamına gelir. Her cümle kafa karıştırıcı olduğundan, yorumunuzu daha fazla okumaya çalışmayacağım.
amip diyor Reinstate Monica,

12

Bunun için gördüğüm en iyi açıklama, matematik eğitiminde olan birinden.

Boş-Hipotez Önemi Testi temelde çelişki bir kanıtıdır: varsayalım için kanıt yokturH0H1 ? Kanıt için varsa , reddetmek ve kabul . Fakat eğer için kanıt , doğru olduğunu varsaydığınız için doğru olduğunu söylemek daireseldir .H1H0H1H1H0H0


4
Belki de şu konuya bakmalısın

10

Eğer hipotez testinin bu sonucundan hoşlanmıyorsanız ama Bayesian yöntemlerine tam bir atılım yapmaya hazır değilseniz, güven aralığına ne dersiniz?

Bir bozuk para çevirme varsayalım kez görmek kafalarının olasılığı için% 95 güven aralığı olduğunu söyleyerek size yol başlarını . 4207820913[0.492,0.502]

Aslında olduğuna dair kanıt , ancak kanıtlar nin ne kadar yakın olabileceğine dair bazı güven .1212


2
Bayesian ile güven aralığı hakkında ne?
kjetil b halvorsen

3
@kjetilbhalvorsen: Bir güven aralığı Bayesian değil (güvenilir bir aralık olur), ancak güven aralığı ispatlar hakkında daha fazla bilgi verir, sonra basit bir hipotez reddi / reddetme olur
Henry

9

Boş bir hipotezin reddedilmemesinin kendi başına boş hipotezin kanıtı olmadığını söylemek belki daha iyi olacaktır. Veri miktarını daha açık bir şekilde dikkate alan verilerin tam olasılığını göz önüne aldığımızda, toplanan veriler boş hipotez içine düşen parametreler için destek sağlayabilir.

Ancak, hipotezlerimizi de dikkatlice düşünmeliyiz. Özellikle, bir nokta boş hipotezini reddetmekte başarısız olmak, nokta boş hipotezinin doğru olduğuna dair çok iyi bir kanıt değildir. Gerçekçi olarak, parametrenin gerçek değerinin söz konusu noktadan o kadar uzak olmadığına dair kanıtlar biriktirir. Boş sıfır hipotezleri bir dereceye kadar yapay yapılardır ve çoğu zaman tam olarak doğru olacağına gerçekten inanmazsınız.

Boş hipotezi destekleyen reddetmeme hakkında konuşmak, eğer boş ve alternatif hipotezi anlamlı bir şekilde tersine çevirebiliyorsanız ve eğer böyle yaparsanız yeni boş hipotezinizi reddedersiniz. Bunu standart bir nokta boş hipotezi ile yapmaya çalıştığınızda derhal tamamlayıcısını reddetmeyi asla başaramayacağınızı görürsünüz, çünkü o zaman ters boş hipoteziniz rastgele dikkate alınan noktaya rasgele yakın değerler içerir.

Öte yandan, söylerseniz, boş hipotezi alternatif karşı normal dağılımın ortalaması için, daha sonra, herhangi bir gerçek değer bir numune boyutu vardır - ve gerçek dışı gerçek değeri sürece olduğunu veya - ki neredeyse% 100 olasılığına sahiptir Seviye güven aralığı, tamamen veya bu aralığın dışına düşecektir . Herhangi bir sonlu örneklem büyüklüğü için, elbette sınır boyunca uzanan güven aralıkları elde edebilirsiniz, bu durumda sıfır hipotezi için bu kadar güçlü bir kanıt yoktur.H0:|μ|δHA:|μ|>δμμδ+δ1α[δ,+δ]


4
+1. Bu IMHO kabul edilen cevap olmalıdır. Neden bu kadar az oy aldığını anlamıyorum.
amip diyor Reinstate Monica,

1
@ amoeba çünkü geç gönderildi, ama katılıyorum ve zaten + 1'ledi.
Tim

6

Bu, dili nasıl kullandığınıza bağlıdır. Pearson ve Neyman karar teorisi uyarınca, bu boş değer için delil değildir, ancak boş gibi doğru davranmanız gerekir.

Zorluk modus ücretlidir. Bayes usulleri endüktif bir akıl yürütme biçimidir ve bu nedenle eksik bir akıl yürütme biçimidir. Boş hipotez yöntemleri, muhtemel bir modus tollens şeklidir ve tümdengelimsel akıl yürütmenin bir parçasıdır ve bu nedenle tam bir akıl yürütme biçimidir.

Modus tollens, "A doğruysa B doğrudur ve B doğru değildir; bu nedenle A doğru değildir" şeklindedir. Bu formda, eğer boş doğruysa, veriler belirli bir şekilde görünecek, bu şekilde görünmeyecekler, bu nedenle (bir dereceye kadar güvenerek) boş doğru değildir (veya en azından "sahtedir"). ."

Sorun şu ki, “Eğer A sonra B ve B” yi istemiş olmanızdır. Bundan A'yı çıkarmak istersiniz, ancak bu geçerli değildir. "Eğer A sonra B," "A değilse B" de geçerli bir ifade değildir. "Bir ayı ise, o zaman yüzebilir. Bir balıktır (ayı değil)" ifadesini düşünün. İfadeler, ayıları olmayanların yüzebilme yetenekleri hakkında hiçbir şey söylemez.

Olasılık ve istatistik bir matematik dalı değil, bir söylem dalıdır. Matematiğin ağır bir kullanıcısıdır ama matematiğin bir parçası değildir. Çeşitli nedenlerden, ikna etme, karar verme veya çıkarımdan dolayı vardır. Bu, söylemleri disiplinli bir delil tartışmasına genişletiyor.


1
Neyman ve Pearson'dan bahsetmek için +1 (bkz. Stats.stackexchange.com/questions/125541 ).
amip diyor Reinstate Monica,

5

Bunu bir örnekle göstermeye çalışacağım.

Bize onun ortalama için testin bir niyet ile, bir nüfustan örnekleme olduğunu düşünelim . Ortalama ile bir örnek alıyoruz . Bir sigara anlamlı p-değeri almak herhangi başka Boş hipotez için test olsaydı, aynı zamanda anlamlı olmayan p değerleri alacağı bu şekilde, arasındadır ve . Şimdi hangi değer için kanıtımız var?μx¯H0:μ=μiμiμ0x¯μ

Ayrıca önemli p değerleri elde ettiğimizde, belirli bir için kanıt elde , bunun yerine ( için kanıt olarak gösterilebilir) aleyhinde bir kanıt. duruma bağlı olarak , veya ). Hipotez testinin niteliği, bir şey için kanıt sağlamaz, eğer öyleyse sadece bir şeye karşı yapar.H1:μ=MH0:μ=μ0μμ0μ<μ0μ>μ0


“Şimdi hangi değer için μ kanıtımız var?” - Örnek ortalamasına daha yakın değerler için daha güçlü kanıtlarımız ve örnek ortalamasından daha ileri değerler için daha zayıf kanıtlarımız var. Ne kadar güçlü veya zayıf, örneklem büyüklüğü ve varyansa bağlıdır. Bu yorumda bir sorun mu var?
Atte Juvonen

Evet bu yanlış bir yorumdur. P değeri, boş hipotezin gerçek olma olasılığı ya da boş hipotez lehine kanıtların gücü değildir. Benzer şekilde, aralığın ortasındaki örnek ortalamasıyla bir aralık tahmini yapabilirsiniz, ancak bu, aralığın ortasına yakın olma popülasyon ortalamasının daha yüksek olduğu anlamına gelmez. Dominic Comtois tarafından sorunuza yapılan yorumdaki bu yanlış yorumlama hakkında iyi bir açıklama yapıldı.
Macond

"Bu, nüfus ortalamanın aralığın ortasına yakın olması olasılığının daha yüksek olduğu anlamına gelmez." - Bu doğru olamaz. Gazeteyi okudum ama bunu doğrulayacak bir şey bulamadım.
Atte Juvonen

Güven aralığının ortası, gözlenen örnek ortalamasını daha yüksek olasılıklarla verecek şekilde ' lere karşılık gelir. Ama bu açıklamaya equavalent değildir: " 'ın yakın ortasına gerçek ortalama olmanın ihtimali daha yüksek". Başkaları tarafından defalarca belirtildiği gibi: . μμP(A|B)P(B|A)
Macond

4

Ortalama olan küçük veri kümesini (aşağıda gösterilmiştir) göz önünde bulundurun, ile iki kuyruklu bir testix¯0tH0:x¯=μμ=0.5p>0.05H0μ=0.5tpμ=0.5μ=0.5

İki alternatif hipotez

pH0pH0 H1μμμ

L(μ|X)=f(X|μ)

μ^μ^μ^f(μ|X)f(X|μ)f(μ|X)μ^. Bu Bayes teoremine yol açar

f(μ|X)=f(X|μ)f(μ)f(X|μ)f(μ)dμ

μμ^μ

H1H0H0, vb. Ondan bazı numaralar isterseniz, bunları size verir, ancak sayılar karşılaştırılamaz . Sorun, hipotez testinin / kehanetinin, başka hipotezleri göz önünde bulundurmadığınız için sadece verilerin başka bir yolla değil, bazı hipotezlerle tutarlı olup olmadığını soran sorulara kesin cevaplar verebileceği bir çerçevede çalışmasıdır .


2

Basit bir örnek izleyelim.

Boş hipotezim, verilerimin normal bir dağılıma uyduğu yönünde. Alternatif hipotez, verilerimin dağılımının normal olmadığıdır.

[0,1] 'de düzgün bir dağılımdan iki rastgele örnek çiziyorum. Sadece iki örneklemle fazla bir şey yapamam, o yüzden boş hipotezimi reddedemezdim.

Bu, verilerimin normal dağılımın ardından sonuç verebileceğim anlamına mı geliyor? Hayır, tek tip bir dağıtım !!

Sorun şu ki, boş hipotezimde normallik varsayımını yaptım. Dolayısıyla varsayımımın doğru olduğu sonucuna varamıyorum çünkü reddedemiyorum.


3
2 numuneli bir çalışmanın "çalışma" olarak nitelendirildiğini sanmıyorum. Makul sayıda veri noktası çizer çizmez bu örnek işe yaramaz. 1000 veri noktası çizersek ve homojen bir dağılıma benziyorlarsa, boş hipotezimize karşı kanıtlarımız var. 1000 veri noktası çizersek normal dağılıma benziyorlarsa, boş hipotezimiz için kanıtlarımız var.
Atte Juvonen

1
@AtteJuvonen Cevabım, bir çalışmanın ne olması gerektiğini tanımlamaya çalışmak değildir. Ben sadece soru için istatistiksel güç eksikliğini göstermek için basit bir örnek vermeye çalışıyorum. Hepimiz 2 numunenin kötü olduğunu biliyoruz.
SmallChess

4
Sağ. Sadece örneğinizin 2 örnekten sonuç çıkarma problemini gösterdiğini söylüyorum. Boş hipotez için kanıt çizme problemini göstermez.
Atte Juvonen


0

Hayır, kanıt olduğuna dair kanıtın yoksa, kanıt değil. Ben sevimli olmaya çalışmıyorum, tam anlamıyla. Null değerinin doğru olduğu varsayımıyla yalnızca bu tür verileri görme olasılığınız vardır. Bu, p değerinden elde ettiğiniz TÜMÜ (eğer öyleyse, çünkü p değeri varsayımlara dayanmaktadır).

Boş hipotezi desteklemeyen "başarısız" olan çalışmalarda, boş hipotezlerin çoğunun doğru çıktığını gösteren bir çalışma sunabilir misiniz? THAT çalışmasını bulabilirseniz, boş hipotezleri ispatlamamanız, en azından sıfırın doğru olduğu ÇOK genel bir olasılığını yansıtır. Bahse girerim o araştırmaya sahip değilsindir. Boş değerlerin p-değerlerine dayanarak doğru olduğuna dair kanıt olmadığına göre, sadece boş elini bırakman gerekir.

Boş değerinin bu p değerini almak için doğru olduğunu varsaymakla başladın, böylece p değeri sana boş hakkında hiçbir şey söylemez, sadece veriler hakkında. Bunu bir düşün. Bu tek yönlü bir çıkarım - dönem.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.