F1 / Zar-Skor vs IoU


24

F1 skoru, Dice skoru ve IoU (sendika kesişme) arasındaki farklar konusunda kafam karıştı. Şimdiye dek F1 ve Dice'in aynı anlama geldiğini öğrendim (doğru?) Ve IoU'nun diğer ikisine çok benzer bir formülü var.

  • F1 / Zar:
    2TP2TP+FP+FN-
  • IoU / Jaccard: kırık
    TPTP+FP+FN-

F1'in gerçek-pozitifleri daha da arttırması dışında, dikkat edilmesi gereken herhangi bir pratik farklılık veya başka şeyler var mı? Birini kullanıp diğerini kullanmadığım bir durum var mı?


Görünüşe göre Jaccard katsayısı da IoU ile aynıdır
pietz

Bu (şimdi 4) ölçümlerin bazıları sadece ikili veriler için yapılıyorsa, özellikle ilgimi çeker.
pietz

Yanıtlar:


38

Doğru yoldasın.

F/2benOUF

benOU/F=1/2+benOU/2

Ancak, bir sınıflandırma alıştırmasının tipik bir sınıflandırma uygulaması için yapılabilecek daha güçlü bir ifade vardır. Herhangi bir sabit “temel gerçek” için, iki ölçü daima pozitif olarak ilişkilendirilir. Yani, A sınıflandırıcısı bir metrik altında B'den daha iyiyse, diğer metriğin altındaki B sınıflandırmasından da daha iyidir.

İki ölçümün fonksiyonel olarak eşdeğer olduğu sonucuna varmak caziptir, bu nedenle aralarındaki seçim keyfidir, ancak çok hızlı değildir! Bir takım çıkarımlar üzerinden ortalama puanı alırken sorun ortaya çıkar . Ardından, herhangi bir vaka için B sınıflandırıcısının A'dan ne kadar daha kötü olduğunu belirlerken fark ortaya çıkar .

Genel olarak, IoU metriği, her ikisinin de kötü olduğu konusunda hemfikir olsalar bile, tek bir kötü sınıflandırma örneğini F puanından daha fazla cezalandırma eğilimindedir. L2'nin L1'den daha büyük hataları nasıl cezalandırdığına benzer şekilde, IoU metriği de F puanına göre hatalar üzerinde "karesi" etkisine sahip olma eğilimindedir. Bu nedenle, F puanı ortalama performansa daha yakın bir şeyi ölçmeye meyilliyken, IoU puanı en kötü durum performansına daha yakın bir şeyi ölçmektedir.

Örneğin, çıkarımların büyük çoğunluğunun B sınıfından A sınıfından orta derecede daha iyi olduğunu, ancak bazılarının Sınıf B'yi kullanarak daha kötü olduklarını varsayalım. Bu durumda, F metrik IoU metriği tercih ettiği sırada F sınıfının A sınıfını tercih ettiği durumda olabilir. sınıflandırıcı B.

Elbette, bu metriklerin her ikisi de farklı olduklarından çok daha fazladır. Ancak her ikisi de, bu puanların ortalamalarını birçok çıkarımda ele alma bakış açısından başka bir dezavantajdan muzdariptir: ikisi de gerçek olmayan gerçek gerçeği pozitif olan setlerin önemini abartmaktadır. Yaygın görüntü segmentasyonu örneğinde, bir görüntü yalnızca tespit edilebilir bir sınıfın tek bir pikseline sahipse ve sınıflandırıcı bu pikseli ve bir başka pikseli tespit ettiğinde, F puanı düşük bir 2/3'tür ve IoU 1 / da daha kötüdür. 2. Bunun gibi önemsiz hatalar, bir dizi görüntü üzerinde alınan ortalama puanı ciddi şekilde etkileyebilir. Kısacası, her piksel hatasını eşit olarak ele almak yerine, seçilen / ilgili kümenin boyutuyla ters orantılı olarak ağırlıklandırır.

c0c1


willem, daha iyi bir cevap isteyemezdim. zaman ayırdığınız için çok teşekkür ederim.
pietz

5
Toplam hata yaklaşımınızı denedim ve sadece pozitifler ile negatifler arasındaki sürekli dengesizliklerle iyi çalışmadığını eklemek istedim. Yalnızca bir pikselin temel hakikat bölümlemesini oluşturduğu görüntülerin tümünün bir kümesini hayal edin. Yapay sinir ağları, boş bir tahminin toplam hatayı kullanarak her zaman% 99,9 doğru olduğunu oldukça hızlı bir şekilde öğrenebilir. IoU veya DSC'ye giderek, ağa yukarıda bahsettiğiniz nedenlerden dolayı bir bölümleme bulması için baskı yapıyoruz. Yani, sonuçta bu çok probleme bağlı.
pietz

1
Birisi aşağıdaki iki ifadeyi uzlaştırmama yardımcı olabilir mi ?: 1: "That is to say that if classifier A is better than B under one metric, it is also better than classifier B under the other metric."ve 2:"It may be the case then that the F metric favors classifier A while the IoU metric favors classifier B."
Matt Kleinsmith 12:17

1
Birincisi, tek bir çıkarımın skoruna atıfta bulunur ve ikincisi, bir çıkarım seti (örneğin, bir resim seti) üzerinden ortalama bir notu ifade eder.
willem
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.