Soru oldukça belirsiz, bu yüzden farklı modelleri karşılaştırmak için uygun bir performans ölçüsü seçmek istediğinizi varsayacağım. ROC ve PR eğrileri arasındaki temel farklara iyi bir genel bakış için aşağıdaki makaleye başvurabilirsiniz: Davis ve Goadrich'in Hassas Geri Çağırma ve ROC Eğrileri Arasındaki İlişki .
Davis ve Goadrich'i alıntılamak için:
Bununla birlikte, çok eğri veri kümeleriyle uğraşırken, Hassas Geri Çağırma (PR) eğrileri bir algoritmanın performansı hakkında daha bilgilendirici bir resim verir.
FPR = FPFP+ TN-,TPR = TPTP+ FN-.
r e c a l l = TPTP+FN-= TPR, ,p r e c i s i o n = TPTP+FP
FP
Hassas geri çağırma eğrileri, yüksek dengesiz veri kümeleri için modeller arasındaki farkları vurgulamak için daha iyidir. Dengesiz ayarlarda farklı modelleri karşılaştırmak istiyorsanız, PR eğrisinin altındaki alan muhtemelen ROC eğrisinin altındaki alandan daha büyük farklılıklar gösterecektir.
Bununla birlikte, ROC eğrileri çok daha yaygındır (daha az uygun olsalar bile). Kitlenize bağlı olarak, ROC eğrileri lingua franca olabilir, bu yüzden bunları kullanmak muhtemelen daha güvenli bir seçimdir. Bir model PR alanında tamamen diğerine hükmediyorsa (örneğin tüm hatırlama aralığında her zaman daha yüksek hassasiyete sahipse), ROC alanında da baskın olacaktır. Eğriler herhangi bir boşlukta kesişirse, diğerinde de geçerler. Başka bir deyişle, hangi eğriyi kullanırsanız kullanın ana sonuçlar benzer olacaktır.
Utanmaz reklam . Ek bir örnek olarak, hem ROC hem de PR eğrilerini dengesiz bir ortamda raporladığım belgelerden birine bakabilirsiniz . Şekil 3, ikisi arasındaki farkı açıkça gösteren, özdeş modeller için ROC ve PR eğrilerini içerir. PR altındaki alanı ROC altındaki alanla karşılaştırmak için tablo 1-2 (AUPR) ve tablo 3-4'ü (AUROC) karşılaştırabilirsiniz; burada AUPR'nin AUROC'dan ayrı modeller arasında çok daha büyük farklılıklar gösterdiğini görebilirsiniz . Bu, PR eğrilerinin bir kez daha uygunluğunu vurgular.