Modelinizin gerçekten A'nın% 40 ve B'nin% 60 şansı olduğunu tahmin ettiğini varsayalım. Bazı durumlarda, bunu B'nin gerçekleşeceği bir sınıflandırmaya dönüştürmek isteyebilirsiniz (çünkü A'dan daha olasıdır). Bir sınıflandırmaya dönüştürüldükten sonra, her tahmin ya doğru ya da yanlıştır ve bu doğru ve yanlış cevapları hesaplamak için bir dizi ilginç yol vardır. Birincisi doğru doğruluktur (doğru cevapların yüzdesi). Diğerleri arasında hassasiyet ve geri çağırma veya F-ölçümü bulunur . Diğerlerinin de belirttiği gibi, ROC eğrisine bakmak isteyebilirsiniz . Ayrıca, bağlamınız gerçek pozitifleri gerçek negatiflerden farklı olarak ödüllendiren ve / veya yanlış pozitifleri yanlış negatiflerden farklı şekilde cezalandıran belirli bir maliyet matrisi sağlayabilir.
Ancak, gerçekten aradığınızı sanmıyorum. B'nin% 60 olma şansı olduğunu söylediyseniz ve bunun% 99 olma şansı olduğunu söyledim, her ikisi de basit bir sınıflandırma sisteminde B'ye eşlense bile çok farklı tahminlerimiz var. Bunun yerine A gerçekleşirse, ben çok yanlışken yanılıyorsun, umarım senden daha sert bir ceza alırım. Modeliniz gerçekten olasılıklar ürettiğinde, bir puanlama kuralı olasılık tahminlerinizin performansının bir ölçüsüdür. Özellikle de uygun bir puanlama kuralı istiyorsunuz , yani puan iyi kalibre edilmiş sonuçlar için optimize edilmiştir.
B S= 1N-Σt = 1N-( ft- ot)2
ftÖt
Elbette seçtiğiniz puanlama kuralı türü, ne tür bir olay öngörmeye çalıştığınıza bağlı olabilir. Ancak, bu size daha fazla araştırma yapmanız için bazı fikirler verecektir.
Ne yaparsanız yapın modelinizi bu şekilde değerlendirirken, örnek dışı veriler (yani modelinizi oluşturmak için kullanılmayan veriler) metriğinize bakmanızı öneririm. Bu çapraz doğrulama ile yapılabilir . Belki daha basit bir şekilde, modelinizi bir veri kümesinde oluşturabilir ve daha sonra başka bir veri üzerinde değerlendirebilirsiniz (örnek dışı sonuçlardan örnek içi modellemeye dökülmemesine dikkat etmek).