Paydalar 0'a eşit olduğunda hassasiyet ve hatırlama için doğru değerler nedir?


16

Hassasiyet şu şekilde tanımlanır:

p = gerçek pozitifler / (gerçek pozitifler + yanlış pozitifler)

(Doğru pozitif + yanlış pozitif) = 0 ise hassasiyetin değeri nedir? Sadece tanımsız mı?

Hatırlama için aynı soru:

r = gerçek pozitifler / (gerçek pozitifler + yanlış negatifler)

Bu durumda, (gerçek pozitifler + yanlış negatifler) = 0 ise hatırlamanın değeri nedir?

Not: Bu soru şu soruya çok benzer : Kenar durumlarda hassasiyet ve hatırlama için doğru değerler nelerdir? .


1
Heh, kopyada bile cevaplandı; ama buna iyi bir kopya diyelim.

Yanıtlar:


9

Bağlantılı önceki sorunun cevapları burada da geçerlidir.

Eğer (gerçek pozitifler + yanlış negatifler) = 0 ise giriş verilerinde pozitif vakalar yoksa, bu vakaya ilişkin herhangi bir analizde bilgi yoktur ve bu nedenle pozitif vakaların nasıl ele alındığına dair bir sonuç yoktur. N / A veya oran sonucuna benzer bir şey istiyorsunuz, sıfır hata ile bölünmeyi önlersiniz

(Gerçek pozitif + yanlış pozitif) = 0 ise, tüm vakaların negatif olduğu tahmin edilmiştir: bu ROC eğrisinin bir sonudur. Yine, sıfır hata ile bölünmeyi önlerken bu olasılığı tanımak ve rapor etmek istersiniz .


Cevabınız için teşekkürler Henry. Eğer doğru anlamak, eski durumda, yok sen ikinci durumda ise, sonuç tanımak ve rapor etmek istediğinizden yapmak . Bu doğru mu?
Raffi Khatchadourian

Evet: Girdi olmayan pozitif durumda, hassasiyet anlamsızdır; pozitif öngörülmeyen durumda, testin son derece negatif olarak ayarlandığını bildirmek istersiniz.
Henry

5

İlginç bir cevap burada sunulmaktadır: https://github.com/dice-group/gerbil/wiki/Precision,-Recall-and-F1-measure

Modülün yazarları, doğru pozitif, yanlış pozitif ve yanlış negatiflerin hepsinin 0 olmasına bağlı olarak hassasiyet ve hatırlama için farklı puanlar çıkarırlarsa, sonuç görünüşte iyi bir sonuçtur.

Bazı nadir durumlarda, Hassasiyet veya Geri Çağırma hesaplaması 0'a bölünmeye neden olabilir. Kesinlik ile ilgili olarak, bu, bir ek açıklamanın cevabı içinde hiçbir sonuç yoksa ve bu nedenle doğru ve yanlış pozitifler 0 olduğunda ortaya çıkabilir. Bu özel durumlar için, eğer gerçek pozitifler, yanlış pozitifler ve yanlış negatiflerin hepsi 0 ise, doğruluk, geri çağırma ve F1 ölçüsü 1 ise, bu durum altın standardın herhangi bir belge içermeyen bir belge içerdiği durumlarda ortaya çıkabilir. ek açıklamalar ve ek açıklama (doğru) hiçbir ek açıklama döndürmez. Gerçek pozitif değerler 0 ve diğer iki sayaçtan biri 0'dan büyükse, kesinlik, geri çağırma ve F1 ölçüsü 0 olur.

Bu tür puanlamanın özel durumları dışındaki diğer durumlarda yararlı olup olmayacağından emin değilim, ancak biraz düşünmeye değer.


1

Bir sınıflandırıcıyı yüksek eşiklerde değerlendirirken, geri çağırma 0 olduğunda hassasiyet (genellikle aslında) 1 olmayabilir. Genellikle N / A! İnsanların P / R eğrisini nasıl çizdikleri hakkında yanlış bir şey olduğunu düşünüyorum. N / A örneklerinden kaçınmak, tekillik örneklerinden kaçınmanız anlamında bir yanlılıktır. Ortalama hassas wrt değerini N / A örneklerini yok sayarak ortalama hatırlamaya hesapladım ve nesne algılamasında sığ bir sinir ağı için 0 geri çağırma için 1'den başlayan bir sınıflandırıcı hiç yoktu. Bu, tp, fp, fn sayılarıyla hesaplanan eğriler için de geçerlidir. Tek bir görüntü ile kağıt ve kalemle doğrulamak oldukça kolaydır. Örneğin: Tek bir görüntü için çıktı veren bir sınıflandırıcım var: preds = [. 7 .6 .5 .1 .05] truth = [nynny] Karışıklık matrislerini çeşitli eşiklerle hesaplayarak: tp = [2 1 1 1 0 0], fn = [0 1 1 1 2 2], fp = [3 3 2 1 1 0]. hatırlama rec = [1, 5, 5, 0 0] ve hassasiyet = [. 4, 25 1/3, 5 0 NaN]. Bir NaN veya hassasiyeti (@ recall == 0) 1 ile değiştirmenin ne kadar mantıklı olduğunu görmüyorum. 1, üst sınır olmalıdır, hassasiyetin (@ recall == 0) yerine koyduğumuz bir değer olmamalıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.