Diyelim ki bir SVM sınıflandırıcımız var, ROC eğrisini nasıl oluştururuz? (Teorik olarak olduğu gibi) (çünkü her bir eşik için TPR ve FPR üretiyoruz). Ve bu SVM sınıflandırıcısı için en uygun eşiği nasıl belirleriz?
Diyelim ki bir SVM sınıflandırıcımız var, ROC eğrisini nasıl oluştururuz? (Teorik olarak olduğu gibi) (çünkü her bir eşik için TPR ve FPR üretiyoruz). Ve bu SVM sınıflandırıcısı için en uygun eşiği nasıl belirleriz?
Yanıtlar:
Bir açıklamalı örnek kümesini sınıflandırmak için SVM sınıflandırıcısını kullanın ve örneklerin bir tahminini temel alan ROC alanında "bir nokta" tanımlanabilir. Örneklerin sayısının 200 olduğunu varsayalım, ilk önce dört vakanın örnek sayısını sayın.
Sonra TPR (Gerçek Pozitif Oran) ve FPR (Yanlış Pozitif Oran) hesaplayın. ve ROC alanında, x ekseni FPR ve y ekseni TPR'dir. Böylece nokta elde edilir.
Bir ROC eğrisi çizmek için, sadece
(1) Doğru veya yanlış olarak etiketlenmiş örnek sayısını kontrol eden bazı eşik değerlerini ayarlayın
Örneğin,% α'nın üzerindeki belirli bir proteinin konsantrasyonu bir hastalığı belirtirse, farklı α değerleri farklı nihai TPR ve FPR değerleri verir. Eşik değerleri basitçe ızgara aramaya benzer şekilde belirlenebilir; Eğitim örneklerini farklı eşik değerlerine sahip etiketleyin, farklı etiketli örnek setlerine sahip tren sınıflandırıcılarını test edin, test verisinde sınıflandırıcıyı çalıştırın, FPR değerlerini hesaplayın ve düşük (0'a yakın) ve yüksek (1'e yakın) FPR'yi kapsayan eşik değerlerini seçin değerler, yani 0, 0,05, 0,1, ..., 0,95, 1
(2) 'e yakın, birçok açıklamalı örnek kümesi oluşturun
(3) Sınıflandırıcıyı örnek setleri üzerinde çalıştırın
(4) Bir (FPR, TPR) noktası hesaplayın her biri için
(5) Nihai ROC eğrisini çizin
Bazı detaylar http://en.wikipedia.org/wiki/Receiver_operating_characteristic adresinde kontrol edilebilir .
Ayrıca, bu iki bağlantı optimal eşiğin nasıl belirleneceği konusunda faydalıdır. Basit bir yöntem, gerçek toplam pozitif ve yanlış negatif oranları ile toplamı almaktır. Diğer hassas kriterler, finansal maliyetler, vb. Gibi farklı eşikleri içeren diğer değişkenleri içerebilir.
Http://www.medicalbiostatistics.com/roccurve.pdf
http://www.kovcomp.co.uk/support/XL-Tut/life-ROC -curves-alıcı-işletim characteristic.html
Bir eşik seçmenin gerçekten kolay bir yolu, bir test seti için pozitif vakaların medyanca öngörülen değerlerini almaktır. Bu senin eşiğin olur.
Eşik, gerçek pozitif oranın (tpr) ve 1 - false pozitif oranın (fpr) çakıştığı roc eğrisini kullanarak alacağınız aynı eşiğe nispeten yakın gelir. Bu tpr (çapraz) 1-fpr çapraz, yanlış negatifleri en aza indirirken gerçek pozitifliği en üst düzeye çıkarır.