Doğru pozitif, yanlış negatif oranlar verildiğinde, yanlış pozitif, gerçek negatif hesaplayabilir misiniz?


24

Ben değerlere sahip True Positive (TP)ve False Negative (FN)aşağıdaki gibi:

TP = 0.25
FN = 0.75

Bu değerlere, biz hesaplayabilir False Positive (FP)ve True Negative (TN)?

Yanıtlar:


53

Bu alanda oldukça fazla terminolojik karışıklık var. Şahsen, bunu düşünmek için bir karışıklık matrisine geri dönmeyi her zaman yararlı buluyorum. Bir sınıflandırma / tarama testinde dört farklı duruma sahip olabilirsiniz:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

Bu tabloda “doğru pozitif”, “yanlış negatif”, “yanlış pozitif” ve “gerçek olumsuz” olaylar (veya olasılıkları). Bu nedenle sahip olduğunuz şey muhtemelen gerçek bir pozitif oran ve yanlış bir negatif orandır . Bu ayrım önemlidir çünkü her iki sayının da pay ve paydaya sahip olduğunu vurgulamaktadır.

İşlerin biraz kafa karıştırdığı nokta, “yanlış pozitif oran” ve “yanlış negatif oran” tanımlarını farklı paydalarla bulabilmenizdir.

Örneğin, Wikipedia aşağıdaki tanımları sağlar (oldukça standart görünüyorlar):

  • TPR,=TP/(TP+FN-)
  • FPR,=FP/(FP+TN-)
  • TN-R,=TN-/(FP+TN-)

Her durumda, payda sütun toplamıdır. Bu aynı zamanda onların yorumlanmasına da bir ipucu verir: Gerçek pozitif oran, gerçek değer gerçekten A olduğunda testin “A” deme olasılığıdır (yani, A'nın şartlı olması şartlı, koşullu bir olasılıktır). Bu, size “A” derken ne kadar doğru olacağınızı söylemez (örneğin, test sonucuna göre koşullu gerçek bir pozitif olma olasılığı “A” dır).

FN-R,=1-TPR,

Ancak literatürde başka tanımlar da vardır. Örneğin, Fleiss ( oranlar ve oranlar için istatistiksel yöntemler ) aşağıdakileri sunar:

  • “[…] Sahte pozitif oran […], aslında hastalıktan arındırılmış pozitif cevap verenler arasında insanların oranıdır.”
  • “Yanlış negatif oran […], yine de hastalığa sahip olan, testte olumsuz yanıt verenler arasında insanların oranıdır.”

(Aynı zamanda önceki tanımları da kabul eder, ancak bunları “kıymetli terminolojiyi boşa harcamış” olarak kabul eder;

FPR,=FP/(TP+FP)FN-R,=FN-/(TN-+FN-)

Fleiss "gerçek negatif oran" veya "gerçek pozitif oran" ifadelerini kullanmaz veya tanımlamaz, ancak belirli bir test sonucu / sınıflandırması verilen koşullu olasılıklar olduğunu varsayarsak, o zaman @ guill11aume cevapları doğru olur.

Her durumda, tanımlara dikkat etmeniz gerekir, çünkü sorunuzun tartışılmaz bir cevabı yoktur.


4
Çok iyi (+1). Hemen bir yoruma atladım, ancak alternatif tanımın standart olduğu konusunda kesinlikle haklısın.
gui11aume

1
@ gui11aume. Teşekkürler! Benim hissimdi ama düşünerek, artık o kadar emin değilim. Referanslara bakıldığında, alana bağlı olabilir (makine öğrenimi vs. tıbbi testler).
Gala,

Tecrübelerime göre, ikinci tanım TPR = TP / (TP + FP), FPR = FP / (TP + FP) daha standart.
travelingbones

1
İşte farklılıkların bir yayın var: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration yeni terminoloji "Test FPR" e karşı "Öngörülü FPR" Not
travelingbones

8

EDIT: daha doğru olan Gaël Laurans'ın cevabını görün.

Gerçek pozitif oranınız 0.25 ise, her pozitif arama yaptığınızda, 0.75 yanlış olma ihtimalinizin olduğu anlamına gelir. Bu senin yanlış pozitif oranın. Benzer şekilde, her negatif araması yaptığınızda, gerçek negatif oranınız olan 0.25 haklı olma ihtimaliniz vardır.


Neyi nitelendirmeye çalıştığına bağlı olarak: önceden gerçeği bilme ayarındaki test veya sadece elde edilen sonuçları verdikten sonra son test olasılığına karar vermeye çalışmak.
kd4ttc

3

Yok eğer "pozitif" ve "negatif" eldeki sorun için bir anlam ifade etmiyorsa, bunun bir anlamı varsa. "Olumlu" ve "olumsuz" un sıralı veya sürekli bir değişkende keyfi zorunlu seçimler olduğu birçok sorun görüyorum. FP, TP, sens, spec sadece ya hep ya hiç fenomenleri için yararlıdır.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.