Her şeyden önce, "doğruluk" u bazen biraz yanıltıcı buluyorum, çünkü bu farklı şeyleri ifade ediyor:
Vadeli doğruluğu sistemleri veya metotları (ı analitik kimyager değilim) değerlendirmek için geneal tahminlerin çalışma önyargı ifade eder, yani iyi tahminler ortalama ne kadar soru cevaplar.
Bildiğiniz gibi, sınıflandırıcılar için performansın farklı yönlerine cevap veren birçok farklı performans ölçüsü vardır. Bunlardan birine de doğruluk denir. Makaleniz makine öğrenimi / sınıflandırma kitlesi için değilse, bu ayrımı çok netleştirmenizi öneririm. Doğrulukun bu daha belirgin anlamı için bile, sınıf dengesizliği ile başa çıkmanın birkaç yolu ortaya çıkabileceğinden, doğruluk dediğim şeyin çok açık olacağını söyleyebilirim. Tipik olarak, sınıf dengesizliği göz ardı edilir ve iyi bilinir.TP+TNall caseshesaplama. Bununla birlikte, ortalamanızı ağırlıklandırarak sınıf dengesizliğini kontrol etmeye karşılık gelen duyarlılık ve özgüllük ortalamasını da kullanabilirsiniz.
F-skor genellikle hassas ve hatırlama harmonik ortalama (veya pozitif öngörü değeri ve hassasiyet) olarak tanıtıldı. Sorunuz için bunu biraz daha açıklamak ve basitleştirmek yararlı olduğunu düşünüyorum:
F=2⋅precision⋅recallprecision+recall=2TPall PTPallTTPall P+TPallT=2TP2all P⋅allTTP⋅all Tall P⋅allT+TP⋅all Pall P⋅allT=2 TP2TP⋅all T+TP⋅all P=2 TPall T+all P
Son ifade, belirli bir grup test vakası olarak düşünebileceğim bir şeyin parçası değildir . Özellikle, DOĞRU ve POZİTİF durumlar arasında (ağır) bir çakışma beklenmektedir. Bu, bir F puanını yüzde olarak ifade etmemi engelleyecek, çünkü bu tür vakaların bir kısmını ima ediyor. Aslında okuyucuya F-skorunun böyle bir yorumu olmadığı konusunda uyardım.