EAA'nın olasılıksal yorumu nasıl elde edilir?


14

Neden ROC eğrisinin altındaki alan, bir sınıflandırıcının rasgele seçilen bir "pozitif" örneği (alınan tahminlerden) rastgele seçilen "pozitif" olandan (orijinal pozitif sınıftan) daha yüksek sıraya koyma olasılığıdır? Gerçek pozitif ve negatif sınıf dağılımlarının CDF'lerini ve PDF'lerini vererek integrali kullanarak bu ifadeyi matematiksel olarak nasıl kanıtlayabiliriz?


Yanıtlar:


10

İlk olarak, ROC eğrisinin altındaki alanı resmi olarak tanımlamaya çalışalım. Bazı varsayımlar ve tanımlar:

  • Bir "skor" s (x) çıkaran olasılıksal bir sınıflandırıcıya sahibiz, burada x, özelliklerdir ve s, tahmini olasılık p'nin (sınıf = 1 | x) jenerik artan monotonik bir fonksiyonudur.

  • k = { 0 , 1 } F k ( s )fk(s) , : = k sınıfı puanlarının , CDF ilek={0,1}Fk(s)

  • Yeni bir gözlemin sınıflandırması, s skorunu t eşiğine göre karşılaştırır

Ayrıca, matematiksel kolaylık sağlamak için, pozitif sınıfı (tespit edilen olay) k = 0 ve negatif k = 1'i ele alalım: Bu ayarda şunları tanımlayabiliriz:

  • Hatırlama (diğer adıyla Duyarlılık, diğer adıyla TPR) : (pozitif olarak sınıflandırılan pozitif vakaların oranı)F0(t)
  • Özgüllük (diğer adıyla TNR) : (negatif olarak sınıflandırılan negatif vakaların oranı)1F1(t)
  • FPR (Düşüş olarak da bilinir) : 1 - TNR =F1(t)

ROC eğrisi karşı nin bir grafiğidir . Ayar : resmen ROC eğrisinin altındaki alan tanımlayabilir Değişken değiştirme ( ): F 1 ( t ) v = F 1 ( s ) A U C = 1 0 F 0 ( F - 1 1 ( v ) ) d v d v = f 1 ( s ) d s A U C = - F 0 ( s ) fF0(t)F1(t)v=F1(s)

AUC=01F0(F11(v))dv
dv=f1(s)ds
AUC=F0(s)f1(s)ds

Bu formülün, sınıf 0 rasgele çizilmiş bir üyesinin, sınıf 1 rasgele çizilmiş bir üyesinin skorundan daha düşük bir skor üretme olasılığı olduğu kolayca görülebilir.

Bu kanıt şu adresten alınır: https://pdfs.semanticscholar.org/1fcb/f15898db36990f651c1e5cdc0b405855de2c.pdf


5

@ alebu'nun cevabı harika. Ancak gösterimi standart dışıdır ve pozitif sınıf için 0, negatif sınıf için 1 kullanır. Aşağıda standart gösterim için sonuçlar (negatif sınıf için 0 ve pozitif sınıf için 1) bulunmaktadır:

Negatif sınıf puanının PDF ve : vef0(s)F0(s)

Pozitif sınıf için pdf ve : vef1(s)F1(s)

FPR =x(s)=1F0(s)

TPR =y(s)=1F1(s)

AUC=01y(x)dx=01y(x(τ))dx(τ)=+y(τ)x(τ)dτ=+(1F1(τ))(f0(τ))dτ=+(1F1(τ))f0(τ)dτ

burada eşik anlamına gelir. Yorum, @ alebu'nun cevabındaki son ifadeye uygulanabilir.τ


1

AUC-ROC'u hesaplamanın yolu TPR ve FPR'yi eşik olarak çizmektir, değiştirilir ve bu eğrinin altındaki alanı hesaplar. Peki, eğrinin altındaki bu alan neden bu olasılıkla aynı? Aşağıdakileri varsayalım:τ

  1. A , modelin aslında pozitif sınıftaki veri noktaları için ürettiği puanların dağılımıdır.
  2. AB , modelin aslında negatif sınıftaki veri noktaları için ürettiği puanların dağılımıdır (bunun solunda olmasını istiyoruz ).A
  3. τ kesme eşiğidir. Bir veri noktası bundan daha yüksek bir puan alırsa, pozitif sınıfa ait olduğu tahmin edilir. Aksi takdirde, negatif sınıfta olduğu tahmin edilir.

TPR'nin (hatırlama) şu şekilde verildiğine dikkat edin: ve FPR (serpinti): .P(A>τ)P(B>τ)

Şimdi, TPR'yi y ekseninde ve FPR'yi x ekseninde çiziyoruz, çeşitli için eğri çiziyoruz ve bu eğrinin altındaki alanı ( ) hesaplıyoruz .τAUC

Biz:

AUC=01TPR(x)dx=01P(A>τ(x))dx
burada FPR'dir. Şimdi, bu integrali hesaplamanın bir yolu tekdüze bir dağılıma ait saymaktır. Bu durumda, basitçe beklentisi haline gelir .xxTPR

(1)AUC=Ex[P(A>τ(x))]
olduğunu düşünürsek .xU[0,1)

Şimdi, burada sadecexFPR

x=FPR=P(B>τ(x))
tekdüze bir dağılımdan olduğunu düşündüğümüzden ,x

P(B>τ(x))U
=>P(B<τ(x))(1U)U
(2)=>FB(τ(x))U

Ancak ters dönüşüm yasasından , herhangi bir rastgele değişken , sonra olduğunu . Bu, herhangi bir rastgele değişken alarak ve kendi CDF'sini uygulayarak üniformaya yol açtığı için bunu takip eder.XFX(Y)~UY~X

FX(X)=P(FX(x)<X)=P(X<FX-1(X))=FXFX-1(X)=X
ve bu sadece üniforma için geçerlidir.

Bu gerçeği denklem (2) 'de kullanmak bize şunu verir:

τ(x)~B

Bunu denklem (1) ile değiştirerek şunu elde ederiz:

birUC=Ex(P(bir>B))=P(bir>B)

Başka bir deyişle, eğrinin altındaki alan, rastgele bir pozitif örneğin rastgele bir negatif örnekten daha yüksek bir puana sahip olma olasılığıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.