Boş hipotezi neden 0.5 düzeyinde değil, 0.05 düzeyinde reddediyoruz (Sınıflandırmada yaptığımız gibi)


11

Hipotez testi bir Sınıflandırma problemine benzer. Diyelim ki bir gözlem (konu) için 2 olası etiketimiz var - Suçlu ve Suçsuz. Suçlu Olmamanın boş Hipotez olmasına izin verin. Sorunu bir Sınıflandırma bakış açısından incelersek, Veriler göz önüne alındığında, 2 Sınıfın her birine ait konunun olasılığını tahmin edecek bir Sınıflandırıcıyı eğitirdik. Daha sonra en yüksek olasılıkla Sınıfı seçerdik. Bu durumda 0,5 olasılık doğal eşik olacaktır. Yanlış Pozitif ve Yanlış Negatif hatalara farklı maliyetler atamamız durumunda eşiği değiştirebiliriz. Ancak nadiren eşiği 0,05'e ayarlamak kadar aşırı olacağız, yani konuyu sadece olasılık 0,95 veya daha yüksek olduğunda Sınıf "Suçlu" ya atayacağız. Ama iyi anlarsam, Hipotez testi problemiyle aynı sorunu gördüğümüzde standart bir uygulama olarak yaptığımız şey budur. Bu son durumda, "Suçsuz" etiketini atamaya eşdeğer olan "Suçsuz" etiketini vermeyeceğiz - sadece "Suçsuz" olma olasılığı% 5'in altındaysa. Ve belki de masum insanları mahkum etmekten gerçekten kaçınmak istiyorsak, bu mantıklı olabilir. Ancak bu kural neden tüm Etki Alanlarında ve tüm durumlarda geçerli olmalıdır?

Hangi Hipotezin benimseneceğine karar vermek, Veriler verildiğinde Hakikat Tahmincisi'ni tanımlamakla eşdeğerdir. Maksimum Olabilirlik Tahmininde, Verilerin daha olası olduğu hipotezini kabul ediyoruz - ezici bir çoğunlukla daha muhtemel olmasa da. Aşağıdaki grafiğe bakın:

resim açıklamasını buraya girin

Maksimum Olabilirlik yaklaşımını kullanarak, bu değerin Sıfır Hipotezinden türetilme olasılığı 0.05'ten büyük olsa da, Tahmin Edicinin değeri 3'ün üzerinde, örneğin 4'ün üstünde ise bu örnekte Alternatif Hipotez'i tercih ederiz.

Gönderiyi başlattığım örnek belki de duygusal olarak yüklü olsa da, örneğin teknik bir gelişme gibi diğer vakaları düşünebiliriz. Veriler bize yeni çözümün iyileştirme olasılığının, bulunma olasılığından daha büyük olduğunu söylediğinde, neden Statüko'ya böyle bir avantaj sağlamalıyız?


1
Temelde RA Fisher'in istatistiklere bilimsel bir araç olarak bakmasına dayanır (buna karşı yeterli kanıt elde edene kadar bir seferde bir hipoteze inan) ve standart sapmanın boş hipotezi çok sık reddetmek arasında yararlı bir denge sağladığı görülüyor. ve yeterli değil2
Henry

1
OP, öncülün burada kusurlu olduğu doğrudur, klasik NHST prosedüründe% 5'i reddetmemizi gerektiren hiçbir şey yoktur. Bu, tartışmalı değere sahip kültürel bir fenomendir.
Matthew Drury

1
@Matthew Drury: "basketbol takımları için uzun boylu insanlar tercih" bir strateji olarak kusurlu olmadığı , sadece o içermediği için ne kadar uzun bir kesin kural olarak. Bildiğiniz gibi, birçok başka sorun olmasına rağmen, kullanıcının nerede çizgi çizeceğini seçmesine izin vermek muhtemelen NHST'nin bir özelliğidir. Riskten kaçınmam, Paris veya Londra'ya yapılan son gezileri dışlamamıştı, ancak birçok ülkeye ziyaretleri ekarte eder: diğer insanlar hattı farklı şekilde çizerdi. Farklı grupların hipotezleri ne zaman reddedecekleri konusunda farklı sözleşmelere sahip oldukları sürece kültürel bir fenomen olduğu konusunda hemfikirim.
Nick Cox

Yorumuma ne okuduğundan emin değilim Nick. Sanırım daha açık olmalıydım. Keşke insanların probleme özgü eşikler belirlemeye daha fazla düşünmelerini diliyorum.
Matthew Drury

NHST'nin kusurlu olduğunu söylüyorsunuz, çünkü belirli bir ret seviyesi anlamına gelmiyor. Soruna özgü eşikler konusunda size katılıyorum.
Nick Cox

Yanıtlar:


17

Diyelim ki mahkemeye çıktınız ve yapmadınız. Sizce hala% 50 suçlu bulunma şansınız var mı? % 50'si masum olma şansı " makul şüphenin ötesinde suçlu " mu? Bunu yapmasanız bile% 5 suçlu bulunmanızın adil olduğunu düşünür müsünüz? Mahkemede olsaydım% 5'in yeterince muhafazakar olmadığını düşünürdüm.

% 5'in keyfi olduğu konusunda haklısınız. Biz de% 2 veya% 1 seçebilir veya nerdy % veya % iseniz . % 10'u kabul etmek isteyen insanlar var, ancak% 50'si asla kabul edilemez.eπe


Soruyu düzenlemenize yanıt olarak:

Tüm hipotezler eşit yaratılmışsa, fikriniz makul olacaktır. Ancak durum böyle değil. Genellikle alternatif hipotezi önemsiyoruz, bu yüzden düşük bir seçersek argümanımızı güçlendiririz . Bu anlamda, başlangıçta seçtiğiniz örnek bu noktayı iyi göstermektedir.α


6
+1 "% 5 keyfi". Academia'daki istatistikçi: " öğretiyoruz çünkü sektörde kullandıkları şey bu". Endüstride İstatistikçi: " çünkü bu bize üniversitede öğretildi". α = 0.05α=0.05α=0.05
knrumsey

8

Söylediğiniz gibi - Yanlış Pozitif ve Yanlış Negatif hataların ne kadar önemli olduğuna bağlıdır.

Kullandığınız örnekte, Maarten Buis'in daha önce yanıtladığı gibi, masum olma olasılığınız% 50 ise mahkum olmak neredeyse adil değildir.

Araştırmaya uygularken şu şekilde bakın: Belirli bir yeni ilacın belirli bir hastalığa karşı yardımcı olup olmadığını bilmek istediğinizi düşünün. Tedavi grubunuz ile kontrol grubunuz arasında tedavi lehine bir fark bulduğunuzu varsayalım. Harika! İlaç işe yaramalı, değil mi? İlacın çalışmadığı yönündeki sıfır hipotezini reddedebilirsiniz. Kişisel p -değeri 0.49 olduğunu! Bulduğunuz etkinin tesadüfen değil, gerçeğe dayanması daha yüksek bir şans var!
Şimdi şunu düşünün: ilacın kötü yan etkileri vardır. Sadece işe yaradığından eminseniz almak istersiniz. Ve sen? Hayır, çünkü iki grup arasında bulduğunuz farkın tamamen tesadüfen olma ihtimali hala% 51.

% 10'dan memnun olduğunuz alanlar olduğunu hayal edebiliyorum. % 10'unun kabul edildiği makaleler gördüm. Ayrıca% 2 seçtikleri makaleler gördüm. Sıfır hipotezini reddetmenin şansa değil gerçeğe dayandığına ikna olmanızın ne kadar önemli olduğunu düşündüğünüze bağlıdır. Bulduğunuz farkın% 100 şansa sahip olma şansından memnun olduğunuz bir durumu hayal bile edemiyorum.


5

Diğer cevaplar hepsi nispeten farklı olası hataları değer bağlıdır ve bu bilimsel bir bağlamda dikkat çekmişlerdir eşit potansiyel oldukça makul daha sıkı kriter potansiyel da oldukça makul, ama bu olası değildir mantıklı ol. Hepsi doğru, ama bunu farklı bir yöne götüreyim ve sorunun arkasında yatan varsayımı sorgulayayım. .50.05.50


"[H] ypothesis testini bir Sınıflandırma problemine benzer olacak şekilde" alıyorsunuz. Burada görünen benzerlik sadece yüzeyseldir; anlamlı bir anlamda bu doğru değil.

Bir ikili sınıflandırma probleminde, gerçekten sadece iki sınıf vardır; kesinlikle kurulabilir ve a priori. Hipotez testi böyle değildir. Rakamınız, bir Stats 101 sınıfındaki bir güç analizini veya hipotez testi mantığını göstermek için sık sık çizildiklerinden, boş ve alternatif bir hipotez görüntüler. Şekil bir sıfır hipotezi ve bir alternatif hipotez olduğunu göstermektedir. Her ne kadar sadece bir null olduğu doğru olsa da, alternatif (ortalama) farkın sadece tek bir nokta değeri olarak sabit değildir. Bir çalışma planlarken, araştırmacılar genellikle tespit etmek istedikleri minimum değeri seçerler. Diyelim ki belirli bir çalışmada bu ortalama bir değişim.67.67Pazarcı. Böylece çalışmalarını buna göre tasarlar ve güçlendirirler. Şimdi sonucun önemli olduğunu düşünün, ancak olası bir değer gibi görünmüyor. Sadece uzaklaşmıyorlar! Araştırmacılar yine de tedavinin bir fark yarattığı sonucuna varacaklardı, ancak sonuçların yorumlanmasına göre etkinin büyüklüğü hakkındaki inançlarını ayarladılar. Birden fazla çalışma varsa, bir meta-analiz, veri biriktikçe gerçek etkinin düzeltilmesine yardımcı olacaktır. Başka bir deyişle, çalışma planlaması sırasında sunulan (ve şeklinle çizilen) alternatif, araştırmacıların tek seçenek olarak sıfır ile null arasında seçim yapması gereken gerçekten tek bir alternatif değildir. .67

Bunu farklı bir yoldan ele alalım. Oldukça basit olduğunu söyleyebilirsiniz: sıfır hipotezi doğrudur ya da yanlıştır, bu yüzden gerçekten sadece iki olasılık vardır. Bununla birlikte, null tipik olarak bir nokta değeridir (viz., ) ve null değerinin yanlış olması, tam olarak dışındaki herhangi bir değerin gerçek değer olduğu anlamına gelir . Bir noktanın genişliğinin olmadığını hatırlarsak, esasen sayı satırının , alternatif olana karşılık gelir. Gözlemlenen sonucu olmadığı sürece Böylece, (yani, sıfır sonsuz sayıda ondalık basamağa) için Sonuç, daha yakın bir dışı olacak bunun için daha değeri (yani,0 100 % 0 ˉ 0 0 0 p < .500100%0.0¯00p<.5). Sonuç olarak, her zaman sıfır hipotezinin yanlış olduğu sonucuna varacaksınız. Bunu açıklığa kavuşturmak için, sorunuzdaki yanlış öneri, önerdiğiniz gibi kullanılabilecek tek, anlamlı bir mavi çizginin (şekildeki gibi) olmasıdır.

Ancak yukarıdakilerin her zaman böyle olması gerekmez. Bazen, teorilerin kesin nokta tahminleri ve muhtemel örnekleme dağılımları vermek için yeterince iyi matematikselleştirildiği bir fenomen hakkında farklı tahminler yapan iki teori vardır. Daha sonra, aralarında ayrım yapmak için kritik bir deney tasarlanabilir. Böyle bir durumda, iki teorinin de null olarak kabul edilmesine gerek yoktur ve olasılık oranı, birini veya diğer teoriyi destekleyen kanıtların ağırlığı olarak alınamaz. Bu kullanım , alfa olarak almaya benzer . Bu senaryonun bilimde en yaygın olamamasının teorik bir nedeni yoktur, şu anda çoğu alanda böyle iki teorinin olması çok nadirdir. .50


3

Önceki çok iyi cevaplara eklemek için: Evet,% 5 keyfi, ancak seçtiğiniz belirli eşik ne olursa olsun, makul derecede küçük olması gerekir, aksi takdirde hipotez testi çok az mantıklıdır.

Bir etki arıyorsunuz ve sonuçlarınızın tamamen şansa bağlı olmadığından emin olmak istiyorsunuz. Bu ölçüde, temelde "Aslında hiçbir etki olmasaydı (sıfır hipotez doğruysa), bu tür sonuçları (ya da daha aşırı) saf şansla elde etme olasılığı" diyen bir önem seviyesi belirlersiniz . Bunu çok yükseğe ayarlamak çok sayıda yanlış pozitif sonuç verir ve araştırma sorunuza anlamlı bir cevap alma yeteneğinizi zayıflatır.

Her zaman olduğu gibi, bir ödünleşim söz konusudur, bu yüzden araştırma topluluğu bu% 5 rehberini ortaya koymuştur. Ama farklı alanlarda farklı. Parçacık fiziğinde, daha çok% 0.00001 gibi bir şey.


0

Sınıflandırma ve hipotez testleri farklıdır ve farklı şekilde kullanılmıştır . Çoğu durumda, insanlar

  • "Bir şeyi paylaşılan niteliklere veya özelliklere göre sınıflandırma" görevini yerine getirmek için "sınıflandırma" ".
  • Ve bazı "önemli keşifleri" doğrulamak için "hipotez testi" ni kullanın.

Hipotez testinde "boş hipotez" in "sağduyu" olduğunu unutmayın, ancak boş hipotezleri reddedebilirsek, yine de bir mola vereceğiz.

Bu nedenle hipotez testinde daha katı kriterlerimiz var. Yeni sürükleme geliştirmenin bir örneğini düşünün, bunun önemli ve etkili olduğunu söylemek için çok dikkatli olmak istiyoruz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.