Hassas geri çağırma eğrisinde "optimal" çalışma noktasını belirlemek için herhangi bir standart yöntem var mı ? (yani, doğruluk ve hatırlama arasında iyi bir denge sağlayan eğrideki noktayı belirlemek)
Teşekkürler
Hassas geri çağırma eğrisinde "optimal" çalışma noktasını belirlemek için herhangi bir standart yöntem var mı ? (yani, doğruluk ve hatırlama arasında iyi bir denge sağlayan eğrideki noktayı belirlemek)
Teşekkürler
Yanıtlar:
"Optimal" tanımı elbette özel hedeflerinize bağlı olacaktır, ancak işte göreceli olarak birkaç "standart" yöntem vardır:
Eşit hata oranı (EER) noktası: hassasiyetin hatırlamaya eşit olduğu nokta. Bu bazı insanlara "doğal" bir operasyon noktası gibi geliyor.
Yukarıdakilerin rafine ve daha ilkeli bir versiyonu, farklı tür hataların maliyetini belirtmek ve bu maliyeti optimize etmektir. Bir öğeyi yanlış sınıflandırmanın (doğruluktaki bir hata), bir öğeyi tamamen kaçırmanın iki katı kadar pahalı olduğunu varsayalım (geri çağırma hatası). O zaman en iyi çalışma noktası, burada (1 - geri çağırma) = 2 * (1 - hassas).
Bazı problemlerde insanlar doğal olarak kabul edilebilir bir hassasiyet veya hatırlama oranına sahiptir. Alınan verilerin% 20'sinden fazlası yanlışsa, kullanıcıların uygulamanızı kullanmayı bırakacağını bildiğinizi varsayalım. O zaman hassasiyeti% 80 (veya biraz daha düşük) olarak ayarlamak ve o noktada hatırladığınız her şeyi kabul etmek doğaldır.
SheldonCooper'ın ikinci ve üçüncü mermi noktalarını takip etmek: İdeal seçim, bir başkasının seçimini bir eşik (nokta 3) veya maliyet avantajı dengesi (nokta 2) şeklinde yapmasıdır. Ve belki de onlara seçim yapmanın en güzel yolu bir ROC eğrisidir .
Bu "standart" ne olduğundan emin değilim, ama bir yolu (1, 1) - yani% 100 hatırlama ve% 100 hassasiyet en yakın noktayı seçmek olacaktır. Bu, iki önlem arasında en uygun denge olacaktır. Bu, geri çağırma üzerinde veya tam tersi olarak hassasiyete değer vermediğinizi varsayar.