Arasındaki bağlantıları (d-asal) ve AUC (ROC eğrisinin altındaki alan); Temel varsayımlar


13

Makine öğreniminde , bir sistemin iki kategori arasında ne kadar iyi ayrım yapabileceğini özetlemek için ROC eğrisinin altındaki alanı (genellikle AUC veya AUROC olarak kısaltılır ) kullanabiliriz. Sinyal algılama teorisinde genellikle (hassasiyet indeksi) benzer bir amaç için kullanılır. İkisi yakından bağlantılıdır ve bazı varsayımların karşılanması durumunda birbirlerine eşdeğer olduklarına inanıyorum .d

hesaplaması genellikle (Ara örneğin yukarıda bağlantı bakınız) sinyal dağılımları için normal dağılımlar varsayarak göre sunulmuştur. ROC eğrisi hesaplaması bu varsayımı yapmaz: eşiklenebilen sürekli değerli bir karar kriteri çıkaran herhangi bir sınıflandırıcıya uygulanabilir.d

Wikipedia , eşdeğer olduğunu söylüyor . Her ikisinin de varsayımları tatmin edildiyse bu doğru görünüyor; ancak varsayımlar aynı değilse, bu evrensel bir gerçek değildir.d2AUC1

Varsayımlardaki farkı "AUC, temel dağılımlar hakkında daha az varsayım yapar" olarak nitelendirmek adil midir? Ya da aslında AUC kadar yaygın olarak uygulanabilir, ancak kullanan kişilerin normal dağılımları kabul eden hesaplamayı kullanma eğilimi olduğu yaygın bir uygulamadır ? Kaçırdığım temel varsayımlarda başka farklılıklar var mı?dd

Yanıtlar:


7

Hayır. AUC'nin maksimum değeri 1'dir. D 'nin maksimum değeri yoktur.

D 'nin qnorm (AUC) * sqrt (2)' e eşit olduğuna inanıyorum (şu anda bulamadığım ancak web'de bulduğum bazı verilere karşı kontrol ettiğim eski bir istatistik kitabının hafızası). Burada qnorm (x) "normal dağılım için kuantil işlevdir" (R-speak). Yani, dağılımın x oranının altında olduğu normal dağılımın değerini döndürür.


2
Teşekkürler, bu benim için doğru görünüyor - ancak, sadece dağılımların normal olduğunu varsayarsak (qnorm () kullanımı nedeniyle). Wikipedia ifadelerini düzelttim.
Dan Stowell
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.