AUC kullanmanın gerekçesi?


10

Özellikle makine öğrenimi literatürünün bilgisayar bilimi odaklı tarafında, AUC (alıcı operatör karakteristik eğrisinin altındaki alan) sınıflandırıcıları değerlendirmek için popüler bir kriterdir. AUC kullanımının gerekçeleri nelerdir? En iyi kararın en iyi AUC'ye sahip sınıflandırıcı olduğu belirli bir kayıp fonksiyonu var mı?


1
AUC bir kayıp fonksiyonudur, bu kayıp fonksiyonu için en uygun kararın en iyi AUC'ye sahip sınıflandırıcı olduğu açıktır.
robin girard

1
@robingirard Hayır değil, çünkü farklı değil, yani doğrudan optimize edemezsiniz.
cpury

Yanıtlar:


15

İkili sınıflandırıcılar için sıralaması için kullanılan (her örnek için, yani Elimizdeki aralığı içinde ) EAA AUC olasılık eşdeğerdir ölçüldüğü bu burada gerçek bir pozitif örnektir ve gerçek bir negatif örnektir. Bu nedenle, maksimum sahip bir model seçmek olasılığını en aza indirir . Yani, gerçek bir negatifi en azından gerçek bir pozitif kadar büyük sıralama kaybını en aza indirir.CeC(e)[0,1]C(e1)>C(e0)e1e0C(e0)C(e1)


0

İyi + kötü domates havuzundan iyi domates tanımlamak için basit bir örnek alalım. Diyelim ki iyi domates sayısı 100, kötü domates 1000, Yani toplam 1100. Şimdi işiniz mümkün olduğunca çok iyi domates tanımlamak. Tüm iyi domatesleri almanın bir yolu 1100 domatesin hepsini almaktır. Ama açıkça b / n good ve bad arasındaki farkı ayırt edemeyeceğinizi söylüyor .

Yani, farklılaştırmanın doğru yolu nedir - çok az kötü olanı alırken çok fazla iyi olanı elde etmek gerekir , Bu yüzden, bir kaç tane iyi olanı aldığımızı söyleyebilen ve kötü olanların neyi saydığını söyleyen bir şeye ihtiyacımız var. o. AUC ölçümü, aşağıda gösterildiği gibi birkaç kötü olanla daha iyi olanları seçebiliyorsa daha fazla ağırlık verir. hangi b / n iyi ve kötü ayırt edebiliyoruz diyor.

Örnekte,% 70 iyi domates toplarken, siyah eğrinin kötü olanların yaklaşık% 48'ini (safsızlık) aldığını, ancak mavi olanın% 83'ü kötü olanı (safsızlık) aldığını gözlemleyebilirsiniz. Yani siyah eğri mavi olana göre daha iyi AUC skoruna sahiptir. resim açıklamasını buraya girin


Bu soruya nasıl cevap veriyor?
Vivek Subramanian

AUC sezgisi ile yazmıştım, yanlış pozitiflerin sayısını azaltırken tüm popülasyonda iyi olanları (ikili sınıflandırmada 1'ler) tanımlamak için tek bir puan vermenize yardımcı oldu. Bunun için daha iyisini nasıl yapabilirdim.
yugandhar
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.