İki istatistik önlemin korelasyon göstermesi muhtemel olsa da, sınıflandırıcının farklı niteliklerini ölçer.
AUROC
Eğri altındaki alan (AUC), bir sınıflandırıcının, rastgele seçilen bir negatif örnekten daha yüksek bir rastgele seçilen pozitif örneği sıralama olasılığına eşittir. Sınıflandırıcıların becerisini , pozitif sınıfa ait oldukları dereceye göre bir dizi diziyi sıralamadaki ölçüsünü ölçmektedir , ancak gerçekte sınıflara desen vermeden.
Genel doğruluk aynı zamanda sınıflandırıcının model sıralaması yeteneğine, aynı zamanda eşiğin üstünde ise pozitif sınıfa ve alt sıra ise negatif sınıfa model atamak için kullanılan sıralamada bir eşik seçme yeteneğine de bağlıdır.
Bu nedenle, AUROC istatistiğinin daha yüksek olduğu (her şeyin eşit olduğu) sınıflandırıcı, aynı zamanda (AUROC'un ölçtüğü) sıralamanın hem AUROC hem de genel doğruluk için faydalı olduğu için daha yüksek bir genel doğruluğa sahip olması muhtemeldir. Bununla birlikte, bir sınıflandırıcı desenleri iyi bir şekilde sıralarsa, ancak eşiği kötü seçerse, yüksek bir AUROC'ye, ancak genel olarak zayıf bir doğruluğa sahip olabilir.
Pratik kullanım
Uygulamada, AUROC'nin genel doğruluğunu ve sınıflayıcıyı sınıf üyeliği olasılığını, çapraz entropi veya öngörücü bilgiyi toplamayı toplamayı seviyorum. Sonra, zor bir sınıflandırma yapmak için ham kabiliyetini ölçen bir metriğe sahibim (yanlış-pozitif ve yanlış-negatif yanlış sınıflandırma maliyetlerinin eşit olduğunu ve numunedeki sınıf frekanslarının operasyonel kullanımdakilerle aynı olduğunu farz ediyorum - büyük bir varsayım!), desen sıralama yeteneğini ölçen bir ölçü ve sıralamanın bir olasılık olarak ne kadar iyi kalibre edildiğini ölçen bir ölçü.
Pek çok görevde, operasyonel sınıflandırma maliyetleri bilinmemektedir veya değişkendir veya operasyonel sınıf frekansları, eğitim örneğindekilerden farklı veya değişkendir. Bu durumda, genel doğruluk genellikle oldukça anlamsızdır ve AUROC daha iyi bir performans göstergesidir ve ideal olarak, operasyonel kullanımda bu sorunları telafi edebilmemiz için iyi kalibre edilmiş olasılıkları ortaya çıkaran bir sınıflandırıcı istiyoruz. Temel olarak hangi metriğin önemli olduğu çözmeye çalıştığımız soruna bağlıdır.