F1 puanının en yakın sezgisel anlamı, hatırlama ve hassasiyetin ortalaması olarak algılanmaktadır. Sizin için temizleyelim:
Bir sınıflandırma görevinde, yüksek hassasiyete ve geri çağırmaya sahip bir sınıflandırıcı oluşturmayı planlıyor olabilirsiniz . Örneğin, bir kişinin dürüst olup olmadığını söyleyen bir sınıflandırıcı.
Kesinlik için, genellikle belirli bir grupta kaç dürüst insan olduğunu doğru bir şekilde söyleyebilirsiniz. Bu durumda, yüksek hassasiyete önem verirken, yalancı bir kişiyi dürüst fakat sıklıkla değil olarak yanlış sınıflandırabileceğinizi varsayarsınız. Başka bir deyişle, burada yalancı bir bütün olarak dürüstten tanımlamaya çalışıyorsunuz.
Ancak, hatırlamak için yalancı bir kişinin dürüst olduğunu düşünüyorsanız, gerçekten endişeleneceksiniz. Senin için, bu büyük bir kayıp ve büyük bir hata olacak ve bir daha yapmak istemezsin. Ayrıca dürüst birini yalancı olarak sınıflandırdıysanız sorun değil, ancak modeliniz asla yalancı birini dürüst olarak iddia etmemelidir. Başka bir deyişle, burada belirli bir sınıfa odaklanıyorsunuz ve bu konuda hata yapmamaya çalışıyorsunuz.
Şimdi, modelinizin (1) yalancı (dürüst) bir şekilde dürüstçe tanımlamasını (2) her iki sınıftaki her bir kişiyi tanımlamasını (geri çağırmayı) isteyin. Bu, her iki ölçümde de iyi performans gösterecek modeli seçeceğiniz anlamına gelir.
Siz model seçim kararınız, daha sonra her bir modeli iki ölçümün ortalamasına göre değerlendirmeye çalışacaktır. F-Score, bunu tanımlayabilecek en iyisidir. Şu formüle bir göz atalım:
Hatırlama: p = tp / (tp + fp)
Hatırlama: r = tp / (tp + fn)
F-puanı: fscore = 2 / (1 / r + 1 / p)
Gördüğünüz gibi yüksek hatırlama VE hassasiyet, daha yüksek F-skoru.