Tip II hatalar istatistiksel literatürde neden bu kadar vurgulanmıyor?


10

Çeşitli araştırma makalelerinde tip I hataların açıklandığı (alfa değeri ile gösterilir) birçok durum gördüm. Bir araştırmacının gücü veya tip II hatasını dikkate almasını nadir buldum.

Tip II hataları büyük bir sorun olabilir mi? Yanlış olan alternatif hipotezi yanlışlıkla reddettik. Alfa değerleri neden beta değerleri yerine bu kadar vurgulanıyor?

İlk yıl istatistiklerini aldığımda, asla beta öğretilmedi - sadece alfa. Bu iki hatanın eşit olarak ele alınması gerektiğini düşünüyorum. Ancak, sadece alfa vurgulanmış gibi görünüyor.


1
+1 Nedeni, geleneksel olarak, önce Tip I hatasının (aka, veya anlam seviyesi ) sabitlenmesidir ve daha sonra test, Tip II hatasını en aza indirecek şekilde (eşdeğer olarak , gücü en üst düzeye çıkarmak gibi) inşa edilir. . Bu konuyu anlamak için wikipedia hakkında yararlı bir makale, Tekdüze En Güçlü (UMP) testlerinde yer alan makaledir, en.wikipedia.org/wiki/Uniformly_most_powerful_testα
Jeremias K

3
"Sıfır hipotezini kabul ettik" konusunda yanılıyorsunuz - asla kabul etmiyoruz. Biz ya "boş hip'i reddediyoruz" ya da "boş hip'i reddedemiyoruz", ama asla boş hip'i kabul etmiyoruz!
caveman

patladı - bu beni geçip gitti. Bunu işaret ettiğiniz için teşekkürler.

1
Kendi deneyiminizi tüm istatistiksel literatür alanı ile karıştırmamaya dikkat edin; okumadığınız materyalin içeriğini çıkartamazsınız.
Glen_b

@glen hemen. Savy bir başlık daha fazla yanıt alır.

Yanıtlar:


5

Bu iyi bir soru. Birkaç açıklama ile başlayayım:


Bence (ne yazık ki) iktidar ve tip II hatalara daha az dikkat ediliyor. Biyomedikal araştırmalarda durumun düzeldiğini düşünüyorum (örneğin, fon ajansları ve IRB'ler genellikle güç analizlerine ihtiyaç duyuyor), bunun birkaç nedeni olduğunu düşünüyorum:

  1. İnsanların anlaması için gücün basit önemden daha zor olduğunu düşünüyorum. (Bu kısmen bir çok bilinmeyene bağlı olduğu için - özellikle etki büyüklüğüne bağlıdır, ancak başkaları da vardır).
  2. Çoğu bilim (yani fizik ve kimya dışında) iyi matematiksel değildir. Sonuç olarak, araştırmacılar için (sadece ) etki büyüklüğüne 'ne' verilmesi gerektiğini bilmek çok zordur . 0
  3. Bilim adamları geleneksel olarak tip I hataların tip II hatalardan daha kötü olduğunu varsaymışlardır.

1
Her zaman olduğu gibi, aydınlatıcı - özellikle matematiksel olmayanlar için :-) ... Bu ifadeyi seviyorum ... Acaba üçüncü noktada biraz genişleyebilir misin ... Bu önyargı için herhangi bir temel var mı? Bunun doğru olduğunu biliyorum, ama neden böyle olduğunu düşünüyorsun ... P-değerinin kupasıyla ilgili olduğu ve başka hiçbir şeyin önemi olmadığı için mi?
Antoni Parellada

Teşekkürler, @AntoniParellada. Daha ne ekleyebileceğimi düşüneceğim.
gung - Monica'yı eski

2
3. noktaya açıklık getireceğim) bilim adamları neden I. tip hataların daha kötü olduğunu düşünüyorlar. Sıfır hipotezi genellikle bir çeşit "statüko" dur, örneğin bu yepyeni ilacın etkisi 0'dır. Statükoyu seviyoruz ve ispat yükümlülüğü, araştırmacının aksini kanıtlaması üzerinedir. Bu nedenle, Tip I hatasını sınırlamak istiyoruz, yani statükoyu yanlış reddediyoruz. IMO, statükoya bu bağlılık sadece felsefi. Eğer fikrimi değiştirmek isterseniz, ispatlamanız gerekecek.
Heisenberg

1
Uygulamada, tip II hatasının çok daha önemli olduğu durumlar kolayca düşünülebilir, yani boş değeri reddetmemenin maliyeti yüksektir. Örneğin, insanlık bir zombi salgınıyla karşı karşıya kalırsa, tutumun "kullanmadan önce işe yaradığını kanıtlamanız gerekir" yerine "işe yaramasa bile herhangi bir ilacı dene" olacağından eminim.
Heisenberg

@Heisenberg'e ekleme: Tip II hatalarının en önemli olduğu durumlarda, nokta hipotez testleri ile denklik testi arasında geçiş yapılmalıdır. Örneğin, önerilen bir worcester sosunun en azından zombi salgınını kötüleştirmediğini kanıtlaması gerekir. Daha sonra hata oranları rollerini değiştirir ve en önemli hata oranı yine tasarımla sabitlenir. Ayrıca, yanlış kararların bazı maliyet tahminleri varsa, riski en aza indiren ve belirli bir tip I hata oranını (mutlaka) düzeltmeyen bir karar kuralı göz önünde bulundurulmalıdır.
Horst Grünbusch

2

Bunun nedeni, gerçek tip II hata oranını bilmememiz ve asla yapmamamızdır. Genellikle bilmediğimiz bir parametreye bağlıdır. Buna karşılık, eğer bu parametreyi bilersek, istatistiksel bir test yapmamız gerekmeyecekti.

Ancak, bazı alternatifler doğru olduğu sürece belirli bir tip II hata oranının karşılanacağı bir deney planlayabiliriz. Bu şekilde, kaynakları boşa harcamayan bir örnek boyutu seçeriz: Ya testin sonunda reddedilmemesi ya da zaten çok daha küçük bir örneklem büyüklüğü hipotezi reddetmek için yeterli olurdu.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.