Kısa bir süre önce Neyman Pearson lemmasını açık bir şekilde söyleyen ve örnek veren bir linkedin blogunda bir yazı yazdım. Lemmada açık bir sezgi sağlama anlamında örnek göz açıklığını buldum. Olasılıkta olduğu gibi, ayrı bir olasılık kütle fonksiyonuna dayanır, böylece pdf'lerle çalışırken olduğundan daha kolay anlaşılır. Ayrıca, olasılık oranını, lemma ifadenizin aksine, alternatif hipotezin ve sıfır hipotezinin olasılığı olarak tanımladım. Açıklama aynı, ancak şimdi olduğundan daha büyük değil. Umut ediyorum bu yardım eder...
Veri analizinde çalışan ve bazı istatistik dersleri almış olanlarınız Neyman-Pearson lemmasını (NP-lemma) öğrenmiş olabilir. Mesaj basit, gösteri çok değil ama her zaman zor bulduğum şey, ne hakkında olduğu konusunda sağduyulu bir his elde etmekti. PIGood ve JWHardin tarafından "İstatistikte Yaygın Hatalar" adlı bir kitap okumak, her zaman özlediğim NP-lemmaya ilişkin bu içgüdüyü hissetmeme yardımcı olan bir açıklama ve örnek aldım.
% 100 matematiksel olarak mükemmel olmayan bir dilde, Neyman-Pearson'ın bize söylediği, belirli bir önem seviyesi dahilinde verilen bir hipotezi doğrulamak için en güçlü testin, bu testten gelen tüm olası gözlemlerle yapılan bir reddetme bölgesi tarafından verildiğidir. Belli bir eşiğin üstünde bir olasılık oranı ... woahhh! Kim kolay olduğunu söyledi!
Sakin ol ve lemayı yapış:
- Hipotez . İstatistiklerde, bir istatistik testinin reddetmesi veya reddetmesi gerektiği iki hipotez ile çalışır. Buna karşı örnek kanıt yeterince güçlü olana kadar reddedilmeyecek olan boş hipotez vardır. Ayrıca, null yanlış gibi görünüyorsa alacağımız alternatif hipotezi de vardır.
- Bir testin gücü (aka duyarlılık) bize, yanlış zaman olduğunda boş hipotezi hangi zamanların doğru şekilde reddedeceğimizi söyler. Güçlü testler istiyoruz, bu yüzden çoğu zaman haklı olduğumuz boş hipotezi reddediyoruz!
- Testin önem düzeyi (yanlış pozitif oran), doğru olduğu zaman boş hipotezi hangi zamanların yanlışlıkla reddedeceğimizi söyler. Küçük bir önem seviyesi istiyoruz, bu nedenle boş hipotezi reddettiğimiz çoğu zaman yanlış değiliz!
- Reddetme bölgesi , testin olası tüm sonuçlarına bakıldığında, reddetme bölgesi, alternatif hipotezi reddetmemize neden olacak sonuçları içerir.
- Olasılık , boş hipotezin (boş hipotezin olasılığı) veya alternatif olanın (alternatif hipotezin olasılığı) doğru olduğu göz önüne alındığında, testin gözlemlenen sonucunu görme olasılığıdır.
- Olabilirlik oranı , boş hipotez olasılığına bölünmüş alternatif hipotez olasılığının oranıdır. Test sonucunun, alternatif hipotez ile alternatif hipotezin doğru olması halinde çok beklenmesi halinde, olasılık oranı küçük olmalıdır.
Yeterli tanım! (Onlara dikkatlice bakarsanız, onların çok anlayışlı olduklarının farkına varacaksınız!). Neyman ve Pearson'ın bize söylediklerine gidelim: mümkün olan en iyi istatistiksel testi yapmak için gücü açısından sadece reddetme bölgesini tanımlayın, olasılık oranının en yüksek olduğu test sonuçlarını ekleyerek ve daha fazla test eklemeye devam edin. Testiniz doğru olduğunda null hipotezini reddetme sayısı için belirli bir değere ulaşana kadar sonuçları (önem düzeyi).
Bakalım her şeyin bir araya geleceği bir örnek görelim. Örnek yukarıda belirtilen kitaba dayanıyor. Tamamen kendi başıma yapılmıştır, bu nedenle herhangi bir gerçeği veya kişisel görüşü yansıttığı görülmemelidir.
Birinin göçmenlik kotalarını (boş hipotez) belirlemenin lehine olup olmadığını (alternatif hipotez) Avrupa Birliği'ne karşı duygularını sorarak belirlemek istediğini düşünün.
Her iki insan için de soruya verdiğimiz yanıtla ilgili gerçek olasılık dağılımını bildiğimizi hayal edin:
Hayal edelim ki% 30'luk bir yanlış pozitif hata kabul etmeye istekli olduğumuzu, yani% 30'luk boş hipotezi reddedeceğimizin ve görüşülen kişinin gerçekte kendileri için kotalara karşı olduğunu varsaydığımızı varsayalım. Testi nasıl yaparız?
Neyman ve Pearson'a göre, ilk önce sonuçları en yüksek olasılık oranına göre alacağız. Bu, 3'lük bir oranla "AB'ye gerçekten benzer" cevabı Kotalar için insanlar aleyhine olduğu gibi (önem). Bununla birlikte, kotadaki insanlara karşı sadece sınıfın% 30'unu (güç) doğru bir şekilde sınıflandıracağız çünkü bu gruptaki herkes AB hakkında aynı düşünceye sahip değildi.
Bu, güç söz konusu olduğunda, zayıf bir sonuç gibi görünüyor. Bununla birlikte, test kota insanları için yanlış sınıflandırmada pek fazla hata yapmamaktadır (önem). Önemlilik konusunda daha esnek olduğumuz için, boş hipotezi reddeden (reddetme bölgesi) cevap çantalarına eklememiz gereken bir sonraki test sonucuna bakalım.
En yüksek olabilirlik oranına sahip olan bir sonraki cevap “AB'ye benzer”. AB’yi kotalar için olan birisinin boş hipotezini reddetmemize izin veren test sonuçları olarak AB’yi "gerçekten" ve "beğeni" olarak kullanırsak, kotalar için zamanın% 30’u (% 10’dan değil) yanlış sınıflandırırız. "gerçekten beğen" ve "beğen" den% 20) ve kotalara karşı zamanın% 65'ini ("gerçekten beğen" in% 30'u ve "beğen" in% 35'i) doğru şekilde sınıflandıracağız. İstatistiksel jargonda: önemimiz% 10'dan% 30'a (kötü!) Yükselirken, testimizin gücü% 30'dan% 65'e (iyi!) Yükseldi.
Bu, tüm istatistiksel testlerin sahip olduğu bir durumdur. İstatistiklerde bile bedava öğle yemeği gibi bir şey yok! Eğer testinizin gücünü arttırmak istiyorsanız, önem seviyesini arttırma pahasına yaparsınız. Ya da daha basit bir ifadeyle: iyi adamları daha iyi sınıflandırmak istiyorsan, daha kötü adamların iyi görünmesi pahasına yapacaksın!
Temel olarak, şimdi bitti! Birinin kotalara karşı olup olmadığını belirlemek için "gerçekten beğen" ve "beğen" etiketlerini kullanarak verilen verilerle yapabileceğimiz en güçlü testi ve% 30'luk anlamlılık düzeyini oluşturduk ... emin miyiz?
"Gerçekten gibi" cevabının seçilmesinden sonra ikinci adımda "beğenmek" yerine "kayıtsız" cevabını seçmiş olsaydık ne olurdu? Testin önemi daha önce% 30 ile aynı olurdu: kota insanlarının% 10'u “gerçekten” gibi ve kota insanlarının% 20'si “hoşlanmamak” şeklinde cevap verdi. Her iki test de kota bireyleri için yanlış sınıflandırmada kötü olacaktır. Ancak, güç daha da kötüleşecekti! Yeni test ile daha önce sahip olduğumuz% 65 yerine% 50'lik bir güce sahip olacaktık: "% 30" dan "% 20 ve" kayıtsız "dan% 20. Yeni test ile kota bireylerine karşı tanımlamada daha az hassas olacağız!
Burada kim yardım etti? Neyman-Kişi olabilirlik oranı dikkate değer bir fikir! Her seferinde en yüksek olabilirlik oranına sahip cevabı almak, yeni teste, önemini kontrol altında tutarken (küçük payda) mümkün olduğunca fazla güç (büyük pay) dahil etmemizi sağlamıştır!