Zar katsayısı doğrulukla aynı mı?


13

Hacim benzerliği ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) ve doğruluk ( https://en.wikipedia.org/wiki/Accuracy_and_precision ) için Zar katsayısına rastlarım ).

Bana öyle geliyor ki bu iki önlem aynı. Düşüncesi olan var mı?


1
Bu, tüm bilgi istatistiklerini
rank1

1
@ rank1 Teşekkürler.
Açıklığa

Yanıtlar:


18

Bunlar aynı şey değildir ve genellikle farklı bağlamlarda kullanılırlar. Zar skoru genellikle görüntü segmentasyonu yöntemlerinin performansını ölçmek için kullanılır . Orada görüntünüzde bazı zemin gerçeği bölgelerine açıklama ekledikten sonra bunu yapmak için otomatik bir algoritma oluşturursunuz. Algoritmayı, nesnelerin ne kadar benzer olduğunun bir ölçüsü olan Zar puanını hesaplayarak doğrularsınız. Dolayısıyla, iki bölümlemenin üst üste binmesinin boyutu, iki nesnenin toplam boyutuna bölünür. Doğruluğunu tarif aynı koşullar kullanılarak, zar puanı:

Zar skoru=2gerçek pozitiflerin sayısı2doğru pozitif sayısı + yanlış pozitif sayısı + yanlış negatif sayısı
, senin yöntem buluntular olduğunu sayıdır gerçek pozitiflerin sayısının Yani, Pozitif Sayısı bulunabilir pozitifler toplam sayısı ve yanlış sayısıdır pozitif, yönteminizin pozitif olarak sınıflandırdığı negatif nokta sayısıdır.

Zar puanı sadece kaç tane pozitif bulduğunuzun bir ölçüsü değildir, aynı zamanda yöntemin bulduğu yanlış pozitifler için kesinlike ceza verir. bu yüzden hassasiyetten doğruluktan daha benzerdir. Tek fark, yalnızca yöntemin bulduğu pozitifler yerine toplam pozitif sayısına sahip olduğunuz paydadır. Bu nedenle Zar skoru, algoritmanızın / yönteminizin bulamadığı pozitifler için de cezalandırıyor.

Düzenleme: Görüntü segmentasyonu durumunda, diyelim ki gerçek yere sahip bir masken var, önerdiğin gibi bir maskesini çağıralım . Bu yüzden maske, bulmaya çalıştığınız bir şeyin olduğu piksellerde 1 değerlerine ve başka sıfır değerine sahiptir. Artık bir ikili görüntü olması gereken görüntü / maske B oluşturmak için bir algoritmanız var , yani bölümleme için bir maske oluşturuyorsunuz. Sonra aşağıdakiler var:

  • Pozitif sayısı, görüntü A'da yoğunluk 1 olan toplam piksel sayısıdırbir
  • Gerçek pozitif sayısı, bir ve B 1 değerine sahip toplam piksel sayısıdır . Böylece bir ve B bölgelerinin kesişimi . bir ve B AND operatörünü kullanmakla aynıdır .
  • Yanlış pozitif sayısı B 1 , bir sıfır olarak görünen piksel sayısıdır .

Bunu bir yayın için yapıyorsanız, Dice'yi büyük bir D ile yazın, çünkü Dice adlı bir adamın ismini almıştır.

DÜZENLEME: Bir düzeltme hakkında yorum ile ilgili olarak: Zar katsayısını hesaplamak için geleneksel formülü kullanmıyorum, ancak diğer cevaptaki gösterime çevirirsem:

Zar skoru=2|birB|2|birB|+|Bbir|+|birB|

Hangi geleneksel tanıma eşdeğerdir. Formülü yanlış pozitif olarak belirtmek için orijinal olarak yazdığım şekilde yazmak daha uygundur. Ters eğik çizgi ayarlanan eksi.


2
Yanıtınız için teşekkürler. Tam olarak görüntü segmentasyonu karşılaştırması için. Bu zar puanı kullanılır, diyelim ki A görüntüsünü ve B görüntüsünü verin. A görüntüsü zemin gerçek (0 veya 1) ve B görüntüsü bölümlememdir. Yani, toplam pozitif (1) sayısı nedir, A'daki 1 sayısı + B'deki 1 sayısıdır ?? Burada biraz kafam karıştı. Yanlış pozitif ile aynı
RockTheStar

1
@RockTheStar Resim segmentasyonu hesabına verdiğim yanıtı düzenleyeceğim.
Gumeo

1
Harika, açıklaman için çok teşekkürler. Bir takip sorusu daha. D aralığı ne olacak? Bu 0 ile 1 arasında mı?
RockTheStar

2
Çok teşekkürler! Bunu uygulayacak ve sonuca bakacak
RockTheStar

2
@Gumeo, cevabınızı düzeltmek veya en azından açıklamak isteyebilirsiniz, ayrıntılar için lütfen yeni cevabım
dvb

20

Zar katsayısı (ayrıca Zar benzerlik indeksi olarak da bilinir) ile aynıdır F1 puanı , ancak doğruluğu ile aynı değil. Temel fark, doğrulukun gerçek negatifleri hesaba katması olabilirken, Zar katsayısı ve diğer birçok önlem gerçek negatifleri ilginç olmayan varsayılanlar olarak ele alır (bkz . Sınıflandırıcı Değerlendirmenin Temelleri, Bölüm 1 ).

Anlayabildiğim kadarıyla, Zar katsayısı, aslında Jaccard endeksi (bilgisayar vizyonunda "birleşim üzerinden kavşak" olarak da bilinir) formülünü içeren önceki bir cevapla açıklandığı gibi hesaplanmaz .

Dbence(bir,B)=2|birB||bir|+|B|F1(bir,B)=2|bir|/|birB|+|B|/|birB|Jbirccbirrd(bir,B)=|birB||mbirx(bir,B)|=|birB||bir|+|B|-|birB|birccurbircy(bir,B)=|birB|+|bir¯B¯||birll|

bir,Bbirll|birB|birB|bir¯B¯|birB

Zar katsayısı ve Jaccard indeksi monoton olarak ilişkilidir ve Tversky endeksi her ikisini de genelleştirmek için, F-skorları, Dice ve Jaccard'ın benzerliklerini görmek için daha fazlasını okuyun .

Zar katsayısı aynı zamanda Hassasiyet ve Hassasiyetin harmonik ortalamasıdır, neden mantıklı olduğunu görmek için F-Measure, Precision ve Recall ölçümlerinin aritmetik ortalaması değil , neden harmonik bir ortalamadır? .

Bu yanıttaki terimlerin birçoğu ve ilişkileri hakkında daha fazla bilgi için bkz . İkili sınıflandırıcıların değerlendirilmesi .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.