Statistics.com yanlış cevabı yayınladı mı?


28

Statistics.com haftanın bir sorununu yayınladı: Konut sigortası dolandırıcılığı oranı% 10 (on iddiadan biri hileli). Bir danışman, talepleri gözden geçirmek ve sahtekarlık veya sahtekarlık olarak sınıflandırmak için bir makine öğrenme sistemi önermiştir. Sistem hileli taleplerin tespitinde% 90 etkilidir, ancak sahtekarlık taleplerinin doğru bir şekilde sınıflandırılmasında yalnızca% 80 etkilidir (yanlışlıkla beşte birini “sahtekarlık” olarak etiketler). Sistem bir talebi sahtekarlık olarak sınıflandırırsa, gerçekten sahtekarlık olasılığı nedir?

https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true

Eşim ve ben ikimiz de aynı cevabı bağımsız olarak bulduk ve yayınlanan çözüme uymuyor.

Bizim çözümümüz:

(* .1 .9) / ((. 9 * .1) + * .9 (. 2)) 1/3 =

Onların çözümü:

Bu şartlı olasılıkta bir sorundur. (Bu aynı zamanda bir Bayesian problemidir, ancak formülü Bayes Kuralı'na uygulamak sadece olup bitenleri gizlemeye yardımcı olur.) 100 iddiaya bak. 10 dolandırıcılık olacak ve sistem 9 tanesini doğru şekilde “dolandırıcılık” olarak etiketleyecektir. hileli olarak, ancak yalnızca 9'u,% 11'i aslında hileli.

Kim haklıydı


4
Görünüşe göre web sitelerinin çözümünü hesapladıklarınızla uyumlu olacak şekilde düzelttiler
hayır

2
@ hayır, sessizce cevabı düzeltildi. sinsi
Aksakal

Diğer bilgiler: Davranışsal karar vermede, bu problem genellikle "mamogram problemi" olarak adlandırılır, çünkü olağan sunumu, hastanın pozitif bir mamogram verilen kansere sahip olma şansı ile ilgilidir.
Kodiolog

"İyi haber şu ki, sistemimiz dolandırıcılığın% 90'ını sahtekarlık olarak sınıflandırıyor. Kötü haber, yolsuzluğun% 80'ini dolandırıcılık olarak sınıflandırması." Hesapladıkları% 11'in yalnızca% 10 baz oranından biraz yüksek olduğunu unutmayın. İşaretli davalarda sahtekarlık oranının taban ücretinden sadece% 10 daha fazla olduğu bir makine öğrenme modeli oldukça korkunç.
Birikim

Yanıtlar:


41

Siz ve meslektaşınızın haklı olduğuna inanıyorum. Statistics.com doğru düşünme hattına sahiptir, ancak basit bir hata yapar. 90 "Tamam" iddiasından,% 20'sinin% 80 değil, dolandırıcılık olarak sınıflandırılmasını bekliyoruz. 90’ın% 20’si 18’dir ve 9 doğru tanımlanmış iddiaya ve 18 yanlış iddiaya, 1/3 oranında, tam olarak Bayes kuralının ne getirdiğini ortaya koymaktadır.


11

Haklısın. Web sitesinin yayınladığı çözüm, hileli olmayan iddiaların% 80'inin verilen% 20 yerine hileli olarak sınıflandırılması nedeniyle sorunun yanlış okunmasına dayanmaktadır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.