Hangisi sıfır hipotezi? Bilim teorisi, mantık ve istatistik arasındaki çatışma?


20

Sıfır hipotezini belirlemede temel mantığı anlamakta güçlük çekiyorum . Bu cevapta , açıkça kabul edilen genel önermenin, sıfır hipotezinin, hiçbir etkisinin olmayacağı, her şeyin aynı kaldığı, yani güneş altında yeni hiçbir şeyin olmadığı hipotezi olduğu belirtilmektedir.

Alternatif hipotez, kanıtlamaya çalıştığınız şeydir, örneğin yeni bir ilacın vaatlerini yerine getirdiği.

Şimdi bilim teorisi ve genel mantıktan geldiğimizi biliyoruz ki önermeleri sahtekârlaştırabiliriz, bir şeyi kanıtlayamayız (hiçbir beyaz kuğu tüm kuğuların beyaz olduğunu kanıtlayamaz, ancak bir siyah kuğu bunu çürütebilir). Bu nedenle, alternatif hipotezi kanıtlamaya eşdeğer olmayan sıfır hipotezini çürütmeye çalışıyoruz - ve bu şüpheciliğimin başladığı yer - kolay bir örnek vereceğim:

Diyelim ki bir perdenin arkasında ne tür bir hayvan olduğunu bulmak istiyorum. Ne yazık ki doğrudan hayvanı gözlemleyemiyorum ama bana bu hayvanın bacak sayısını veren bir testim var. Şimdi şu mantıksal akıl yürütmem var:

Hayvan bir köpekse, o zaman 4 bacağı olacaktır.

Testi yaparsam ve 4 bacağı olduğunu öğrenirsem, bu bir köpek olduğuna dair bir kanıt yoktur (bir at, gergedan veya herhangi bir 4 bacaklı hayvan olabilir). Ama 4 bacağı olmadığını öğrenirsem, bu bir köpek olamayacağının kesin bir kanıtıdır (sağlıklı bir hayvan varsayalım).

İlaç etkinliğine çevrildi Perdenin arkasındaki ilacın etkili olup olmadığını öğrenmek istiyorum. Alacağım tek şey bana etkiyi veren bir sayı. Etki pozitifse, hiçbir şey kanıtlanmamıştır (4 bacak). Etkisi yoksa, ilacın etkinliğini reddederim.

Tüm bunları söyleyerek - ortak bilgeliğin aksine - tek geçerli sıfır hipotezi

İlaç etkilidir (yani: ilaç etkili ise bir etki göreceksiniz).

çünkü bu daha çürütebileceğim tek şey - daha spesifik olmaya çalıştığım bir sonraki tura kadar. Dolayısıyla etkiyi belirten sıfır hipotezi ve alternatif hipotez varsayılan değerdir ( etki yok ).

İstatistiksel testler neden geriye dönük görünüyor?

PS : Bunu Hatta, geçerli bir eşdeğer hipotezi almak için yukarıdaki hipotezi yadsınamayacak olamaz "ilaçtır demek değil görürseniz sadece mantıksal eşdeğer formu" olacağını, çünkü boş hipotezi olarak etkili" hayır etkisi ilaç olacak değil olmak etkili "ki bu sizi hiçbir yere götürmez çünkü şimdi sonuç öğrenmek istediğiniz şeydir!

PPS : Şimdiye kadar cevapları okuduktan sonra açıklığa kavuşturmak için: Bilimsel teoriyi kabul ederseniz, sadece ifadeleri tahrif edip kanıtlayamazsanız, mantıksal olarak tutarlı olan tek şey yeni hipotezi yeni teori olarak seçmektir. tahrif. Çünkü statükoyu tahrif ederseniz boş bırakılırsınız (statüko reddedilir, ancak yeni teori kanıtlanmaktan uzaktır!). Ve eğer onu tahrif edemezseniz, daha iyi bir konumda değilsinizdir.


3
İpucu: "İlaç etkilidir", bilimsel veya istatistiksel bir açıklama olarak yeterince ölçülmemiştir. Bunu nasıl nicel kılacaksınız?
whuber

1
@whuber: Sorunlarımdan en azı bu: Örneğin kan basıncının% 10 azaldığını söyleyin. Bunun sıfır hipotezi olması gerektiğini savunuyorum - alternatif hipotez "Hiçbir şey olmaz".
vonjd

9
Tam tersine, bu temel özellik söz konusu. Etkinin% -10 olduğunu söyleyen bir boş poz vermek istatistiklerde gayet iyi. Denemeniz, aksi yönde yeterince güçlü kanıtlar ürettiğinde reddedebilir. Bununla birlikte, (olağanüstü hesaplama ve kavramsal işlemlerin engellenmesi), deney başına sadece böyle bir hipotezi test edebileceğinizi unutmayın. Ayrıca, etki büyüklüğünün ne olacağını tam olarak bilen nadir deneyci olduğunu unutmayın (ancak yine de test etme ihtiyacı hissediyor!).
whuber

3
Peki, ilaç denemeleri ile pratikte null genellikle "ilaç mevcut tedaviden daha etkili değildir" ve alternatif "ilaç mevcut tedaviden daha etkilidir" olarak yorumlanır. Bu, tesadüfen yerleşik bir etki boyutuna sahiptir. Bu formülasyon ile, delil için ilacın etkinliği null adlı reddedebilir. Hipotezleri değiştirdikten sonra, etkinliğe ilişkin kanıtlar sadece bir kişinin ilacın iyi olduğu iddiasını reddetmesini engeller. İlk durumda, ispat yükü çok daha katıdır.
whuber

1
@vonjd: "Eğer statükoyu yanlış yaparsan boş bırakılırsın" diyorsun. Yanlış. Eğer “köpek” / “köpek değil” olarak nitel yargılar yapıyorsak, “köpek değil” kanıtı sağlamanın “köpek” için özellikle güçlü bir kanıt olmadığı doğrudur. Ancak, bu şeyleri nicelleştirmenin değeri. Eğer "0 değil" kanıtı sunursam, bu değerin 0 dışında bir şey olduğuna dair iyi kanıt sağlarsa, iyi bir etki ve kötü bir etki için eşit kanıt sağlayan endişeleriniz varsa, tek kuyruklu bir test kullanın.
russellpierce

Yanıtlar:


12

İstatistiklerde, eşdeğerlik testlerinin yanı sıra Null'un daha yaygın testi de vardır ve buna karşı yeterli kanıt olup olmadığına karar verir. Eşdeğerlik testi bunu başa çevirir ve etkilerin Null'dan farklı olduğunu öne sürer ve bu Null'a karşı yeterli kanıt olup olmadığını belirleriz.

Uyuşturucu örneğinde net değilim. Yanıt, efektin bir değeri / göstergesiyse, 0 etkisi etkili olmadığını gösterir. Biri bunu Null olarak ayarlayacak ve buna karşı kanıtları değerlendirecektir. Etki sıfırdan yeterince farklıysa, etkinliksizlik hipotezinin verilerle tutarsız olduğu sonucuna varabiliriz. İki kuyruklu bir test, Null'a karşı kanıt olarak yeterli negatif etki değerlerini sayar. Tek kuyruklu bir test, etki pozitiftir ve sıfırdan yeterince farklıdır, daha ilginç bir test olabilir.

Etkinin 0 olup olmadığını test etmek isterseniz, bunu tersine çevirip H0'ın etkinin sıfıra eşit olmadığı bir denklik testi kullanmamız gerekir ve alternatif H1 = etki = 0'dır. Etkinin 0'dan farklı olduğu fikrine karşı kanıtları değerlendirir.


9
Buradaki sorunun bir kısmı, IIRC, etkisiz değeri Null olarak seçmemizin nedeni, bu etkinin parametresinin bilinmesidir 0. Bunu tersine çevirmek ve Null olarak sıfır olmayan bir etkiye sahip olmak istiyorsanız, bu parametrenin değerinin tüm popülasyon için ne olduğunu önceden bilmemiz gerekir ve eğer parametrenin değerini nüfusun test edilmesinin bir anlamı olmazdı.
Monica'yı eski durumuna getirin. G. Simpson

Görünüşe göre alternatif hipotez ile aynı sorunu yaşıyor olacağız (oradaki parametreyi de bilmiyoruz). Benim sorum şu: Neden ikisini de değiştirmiyorsunuz? Bu mantıksal olarak daha tutarlı görünüyor.
vonjd

Diğerlerinin denklik testleri hakkında yorum yapmasına izin vereceğim. Standart testlerde sadece hipotezleri değiştirmekle aynı şey değiller, ama bu fikirlere aşina değilim. Eşdeğerlik testlerinin yorumlarda bahsettiğim sorundan muzdarip olduğunu doğru bulmuyorum. Bunlar çok farklı bir teorik bakış açısıyla formüle edilmiştir.
Monica'yı eski durumuna getirin - G. Simpson

5

Bu, sık sık istatistiklerin gerçekten sormak istediğiniz soruya doğrudan bir cevap veremediği ve bu yüzden (hayır) ince bir şekilde farklı bir soruyu cevaplayamadığı ve bunu doğrudan bir cevap olarak yanlış yorumlamanın kolay olduğu başka bir durum olduğunu düşünüyorum. aslında sormak istediğin soru.

Gerçekten sormak istediğimiz şey, normalde alternatif hipotezin doğru olma olasılığının ne olduğudur (ya da belki de doğru olma olasılığının sıfır hipotezden daha fazladır). Bununla birlikte, frekansçı bir analiz temel olarak bu soruya cevap veremez, bir frekansçıya göre bir olasılık uzun bir çalışma frekansıdır ve bu durumda uzun çalışma frekansı olmayan belirli bir hipotezin gerçeğiyle ilgileniriz - ya doğru ya da değil. Öte yandan bir Bayes olabilir bir olasılık bazı önermenin inandırıcılık bir ölçüsüdür aa Bayesian şekilde belirli bir hipotezin gerçeğe bir olasılık atamak için bir Bayes analizde mükemmel makul olduğunu, doğrudan bu soruya cevap.

Frekansçıların belirli olayları ele alma şekli, onları bazı (muhtemelen hayali) popülasyondan bir örnek olarak ele almak ve belirli bir örnek hakkında bir ifade yerine bu popülasyon hakkında bir açıklama yapmaktır. Örneğin, belirli bir madalyonun önyargılı olma olasılığını bilmek istiyorsanız, N döndürmeyi gözlemledikten ve h başlarını ve kuyruklarını gözlemledikten sonra, sıkça yapılan bir analiz bu soruya cevap veremez, ancak size bir dağılımın para oranını söyleyebilirler. N kere çevrildiğinde h veya daha fazla kafa verecek tarafsız paralar. Günlük yaşamda kullandığımız bir olasılığın doğal tanımı, sık sık bir Bayes olmaktan ziyade genellikle Bayesci bir durum olduğundan, bunu sıfır hipotezinin (madeni para tarafsızdır) doğru olması olasılığı olarak ele almak çok kolaydır.

Esasen, sık sık hipotez testleri, kalbinde gizlenen bir subjektivist Bayes bileşenine sahiptir. Sıklık testi size en azından sıfır hipotezi altında bir istatistiği gözlemleme olasılığını söyleyebilir, ancak bu gerekçelerle sıfır hipotezini reddetme kararı tamamen özneldir, bunun için rasyonel bir gereklilik yoktur. Essentiall deneyimi, p-değeri yeterince küçükse (yine eşik özneldir), null'u reddetmek için genellikle makul bir dayanakta olduğumuzu göstermiştir, bu yüzden gelenek budur. AFAİK bilim felsefesine ya da teorisine pek uymuyor, aslında sezgisel.

Bu, kötü niyetli bir şey olmasına rağmen, sık rastlanan hipotez testlerinin araştırmamızın üstesinden gelmesi gereken bir engel oluşturduğu anlamına gelmez, bu da bilim adamları olarak kendi şüpheciliğimizi korumamıza ve teorilerimize olan coşkuyla taşınmamıza yardımcı olur. Bu yüzden kalbimde bir Bayesiyken, sık sık hipotez testlerini düzenli olarak kullanıyorum (en azından dergi gözden geçirenleri Bayesain alternatifleriyle rahat olana kadar).


3

Gavin'nin cevabına eklemek için birkaç şey:

İlk olarak, önermelerin sadece sahte olabileceği, ancak asla kanıtlanamayacağı fikrini duydum. Bunun tartışmasına bir bağlantı gönderebilir misiniz, çünkü buradaki ifadelerimiz çok iyi görünmüyor - X bir öneri ise, (X) da bir öneri değildir. Önermeyi reddetmek mümkünse, X'i reddetmek (X) 'i kanıtlamakla aynıdır ve bir öneri kanıtladık.

test+

İlaç etkilidir (yani: eğer ilaç etkiliyse bir etki göreceksiniz).

test+test+H0 . Ancak etkili bir ilaç pozitif bir testi garanti etmez; ilaç etkili ve varyans yüksek olduğunda, etki testte maskelenebilir.

test+H0test+H0

Dolayısıyla, köpek davası ile etkililik davası arasındaki fark, delilden sonuca çıkarımın uygunluğudur. Köpek durumunda, bir köpeği güçlü bir şekilde ima etmeyen bazı kanıtlar gözlemlediniz. Ancak klinik araştırma vakasında, etkinliği kesin olarak ima eden bazı kanıtlar gözlemlediniz.


1
Teşekkür ederim. İfadeleri yalnızca yanlışlaştırabileceğinizi ancak bunları kanıtlayamayacağınızı kabul ederseniz (bir saniyede bağlantı) mantıksal olarak tutarlı olan tek şey sıfır hipotezini yeni teori olarak seçmektir - o zaman tahrif edilebilir. Eğer statükoyu tahrif ederseniz boş bırakılırsınız (statüko reddedilir ancak yeni teori kanıtlanmaktan uzaktır!) Şimdi bağlantı için, iyi bir başlangıç ​​noktası olacağını düşünüyorum: en.wikipedia.org/wiki/Falsifiability
vonjd

2
Sanırım burada değinilmesi gereken bir nokta, sıfır hipotezini kanıtlamamanız veya çürütmemenizdir. Verdiğiniz karar (klasik olarak) sıfır hipotezini korumak veya reddetmektir. Sıfır hipotezini reddettiğinizde çürütmezsiniz. Yaptığınız tek şey, gözlemlenen veriler göz önüne alındığında, sıfır hipotezinin olası olmadığını söylüyor.
russellpierce

@drknexus: Peki, bunun mantıktaki tahrifatın olasılıklı eşdeğeri olduğunu kabul etmiyor musunuz?
vonjd

4
@drknexus "Gözlenen veriler göz önüne alındığında, sıfır hipotezi düşüktür" demek yerine daha doğrusu "sıfır hipotezi doğruysa bu veriler düşüktür" demek daha doğru olmaz mıydı? Bu ikisini istatistiksel hipotez testindeki klasik hata ile karıştırmamak mı?
Michael McGowan

1
MM: Haklısın. İfadelerimde özensizlik var.
russellpierce

3

Bir anlamda, sık hipotez testinin bir geriye doğru sahip olduğu konusunda haklısınız. Bu yaklaşımın yanlış olduğunu söylemiyorum, aksine sonuçlar genellikle araştırmacının en çok ilgilendiği soruları cevaplamak için tasarlanmamıştır. Bilimsel yönteme daha benzer bir teknik istiyorsanız, Bayesian çıkarımını deneyin .

Reddedebileceğiniz veya reddedemeyeceğiniz bir "boş hipotez" hakkında konuşmak yerine, Bayesci çıkarımla, mevcut durumu anlamanıza dayanarak önceden olasılık dağılımıyla başlarsınız. Yeni kanıt elde ettiğinizde, Bayesian çıkarsama, inancınızı dikkate alınan kanıtlarla güncellemeniz için bir çerçeve sağlar. Bence bilimin işleyişine bu kadar benziyor.


3

Bence burada temel bir hata var (hipotez testinin tüm alanı açık değil!) Ama alternatifi kanıtlamaya çalıştığımız şey olduğunu söylüyorsun. Ama bu doğru değil. Boş değeri reddetmeye (tahrif etmeye) çalışıyoruz. Eğer null doğruysa elde ettiğimiz sonuçlar çok düşük bir olasılıksa, null değerini reddederiz.

Şimdi, diğerlerinin söylediği gibi, bu genellikle sormak istediğimiz soru değildir: Null doğruysa sonuçların ne kadar olası olduğunu umursamıyoruz, sonuçlar göz önüne alındığında null'un ne kadar olası olduğunu önemsiyoruz.



2

Paul Meehl'den @Doc tarafından bahsedeceğim:

1) Araştırma hipotezinizin tersini sınama olarak sıfır hipotezi bunu yapar, böylece yalnızca "resmi olarak geçersiz" bir argüman olan sonucu doğrulayabilirsiniz. Sonuçların öncülden gelmesi gerekmez.

If Bill Gates owns Fort Knox, then he is rich.
Bill Gates is rich.
Therefore, Bill Gates owns Fort Knox.

http://rationalwiki.org/wiki/Affirming_the_consequent

Teori "Bu ilaç iyileşmeyi artıracaktır" ise ve iyileşmenin iyileştiğini gözlemlerseniz, bu teorinizin doğru olduğunu söyleyebileceğiniz anlamına gelmez. İyileşmiş iyileşmenin ortaya çıkması başka bir nedenden dolayı meydana gelmiş olabilir. Hiçbir hasta veya hayvan grubu başlangıçta tam olarak aynı olmayacak ve çalışma sırasında zamanla daha fazla değişmeyecektir. Bu gözlemsel için deneysel araştırmalardan daha büyük bir problemdir çünkü randomizasyon, başlangıçta bilinmeyen karıştırıcı faktörlerin ciddi dengesizliklerine karşı "savunur". Ancak, rasgeleleştirme sorunu gerçekten çözmez. Eğer karışıklıklar bilinmiyorsa, "rasgeleleştirme savunması" nın ne kadar başarılı olduğunu anlatamıyoruz.

Ayrıca bkz. Tablo 14.1 ve hiçbir teorinin neden kendi başına test edilemediğine ilişkin tartışma (her zaman birlikte etiketlenen yardımcı faktörler vardır):

Paul Meehl. LL Harlow, SA Mulaik ve JH Steiger'de (Eds) Önemlilik Testlerini Güven Aralıklarıyla Değiştirin ve Riskli Sayısal Tahminlerin Doğruluğunu Nicelleştirin " Önemlilik Testi Olmasaydı? (s. 393–425) Mahwah, NJ: Erlbaum, 1997.

2) Eğer bir tür önyargı ortaya çıkarsa (örneğin, bazı karıştırıcı faktörler üzerindeki dengesizlik), bu önyargının hangi yönde ya da ne kadar güçlü olacağını bilmiyoruz. Verebileceğimiz en iyi tahmin, tedavi grubunu daha yüksek iyileşme yönünde saptırma olasılığının% 50 olmasıdır. Örnek boyutları büyüdükçe, önem testinizin bu farkı tespit etme şansı da% 50'dir ve verileri teorinizi doğrulayan olarak yorumlayabilirsiniz.

Bu durum, "Bu ilacın iyileşmeyi% x artıracağı" null hipotezinden tamamen farklıdır. Bu durumda (hayvan ve insan gruplarını karşılaştırırken daima var olduğunu söyleyebilirim) herhangi bir önyargı varlığı, teorinizi reddetmenizi daha olası hale getirir.

Mümkün olan en uç ölçümlerle sınırlandırılan olası sonuçların "uzayını" (Meehl "Spielraum" olarak adlandırır) düşünün. Belki% 0-100 iyileşme olabilir ve% 1 çözünürlükle ölçebilirsiniz. Ortak önem testi durumunda, teorinize uygun alan gözlemleyebileceğiniz olası sonuçların% 99'u olacaktır. Belirli bir farkı tahmin ettiğinizde, teorinizle tutarlı olan alan olası sonuçların% 1'i olacaktır.

Bir başka ifade etmek gerekirse, ortalama1 = ortalama2 değerinin sıfır hipotezine karşı kanıt bulmak , bir ilacın bir şey yaptığını araştırma hipotezinin ciddi bir testi değildir . Ortalama1 <ortalama2 değerinin null değeri daha iyidir, ancak yine de çok iyi değildir.

Bkz. Şekil 3 ve 4: (1990). Teorileri değerlendirmek ve değiştirmek: Lakatosian savunmanın stratejisi ve bunu kullanmayı gerektiren iki ilke . Psikolojik Araştırma, 1, 108-141, 173-180


0

Tüm istatistikler doğal dünyada hiçbir şeyin kesin olmadığı varsayımına dayanmaz (insan yapımı oyun dünyasından & c'den farklı olarak). Başka bir deyişle, bunu anlamaya yaklaşmanın tek yolu, bir şeyin diğeriyle ilişkili olma olasılığını ölçmektir ve bu 0 ile 1 arasında değişir, ancak sadece hipotezi sonsuz sayıda kez test edebiliyorsak 1 olabilir elbette imkansız olan sonsuz sayıda farklı koşul. Aynı sebepten dolayı sıfır olduğunu asla bilemeyiz. Doğanın gerçekliğini anlamak için mutlak olarak uğraşan ve çoğunlukla idealist olduğunu bildiğimiz denklemlere dayanan matematikten daha güvenilir bir yaklaşımdır, çünkü kelimenin tam anlamıyla bir denklemin LH tarafı gerçekten = RH tarafı, iki taraf ise tersine çevrilebilir ve hiçbir şey öğrenemezdik. Kesin olarak söylemek gerekirse, sadece statik bir dünya için geçerlidir, kendinden türbülanslı olan 'doğal' bir dünya için geçerli değildir. Dolayısıyla, sıfır hipotezi, doğanın kendisini anlamak için her kullanıldığında matematiğin bile altına yazılmalıdır.


0

Bence sorun 'gerçek' kelimesinde. Doğal dünyanın gerçekliği, zaman içinde sonsuz karmaşık ve sonsuz değişken olduğu için doğası gereği bilinemez, bu nedenle doğaya uygulanan 'hakikat' her zaman şartlıdır. Tek yapabileceğimiz, tekrarlanan deneylerle değişkenler arasındaki olası yazışma seviyelerini bulmaya çalışmaktır. Gerçekliği anlamlandırma girişimimizde, mantıklı bir düzen gibi görünen şeyleri ararız ve mantıklı kararlar almamıza yardımcı olmak için zihnimizde kavramsal olarak bilinçli modeller oluştururuz, ancak her zaman beklenmedik. Sıfır hipotezi, gerçeği anlamlandırma girişimimizdeki tek güvenilir başlangıç ​​noktasıdır.


1
Bence iki cevabını birleştirmelisin.
vonjd

-1

Reddetmek istediğimiz boş hipotezi seçmeliyiz.

Çünkü hipotez testi senaryomuzda kritik bir bölge vardır, eğer hipotez altındaki bölge kritik bölgeye gelirse, hipotezi reddederiz, aksi takdirde hipotezi kabul ederiz.

Kabul edelim ki sıfır hipotezini seçtiğimizi varsayalım. Ve sıfır hipotezi altındaki bölge kritik bölgeye gelmez, Bu yüzden sıfır hipotezini kabul edeceğiz. Ancak buradaki sorun, sıfır hipotezi altındaki bölgenin kabul edilebilir bölgeye gelmesi, alternatif hipotez altındaki bölgenin kabul edilebilir bölgeye gelmeyeceği anlamına gelmez. Ve eğer durum buysa, sonuç hakkındaki yorumumuz yanlış olacaktır. Bu yüzden bu hipotezi sadece reddetmek istediğimiz bir sıfır hipotezi olarak almalıyız. Sıfır hipotezini reddedebilirsek, alternatif hipotezin doğru olduğu anlamına gelir. Fakat eğer sıfır hipotezini reddedemezsek, bu iki hipotezden herhangi birinin doğru olabileceği anlamına gelir. Daha sonra başka bir sınava girebiliriz, burada alternatif hipotezimizi sıfır hipotez olarak alabiliriz, ve sonra onu reddetmeye çalışabiliriz. Alternatif hipotezi (şimdi boş hipotez olan) reddedebilirsek, ilk sıfır hipotezimizin doğru olduğunu söyleyebiliriz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.