Aklıma birkaç olasılık geliyor.
Genel vuruş oranına bakmak genellikle çok iyi bir fikir değildir, çünkü farklı sınıfların performansı farklıysa test setinin bileşimine bağlı olacaktır. Bu nedenle, anlamlı bir değer elde etmek için en azından test verilerinizdeki sınıfların göreceli sıklığını belirtmeniz (ve gerekçelendirmeniz) gerekir.
İkinci olarak, @Shorack'ın daha önce de söylediği gibi, hangi hata türlerinin ne kadar önemli olduğunu belirtin. Genellikle sınıflandırıcının yararlı olması için belirli performans kriterlerini karşılaması gerekir (ve genel doğruluk nadiren yeterli önlemdir). Farklı sınıfları ve farklı sınıflandırma türlerini dikkate alan duyarlılık, özgüllük, pozitif ve negatif prediktif değer gibi önlemler vardır. Bu önlemlerin sınıflandırıcı ile ilgili farklı soruları yanıtladığını söyleyebilirsiniz:
- duyarlılık: Gerçekten C sınıfına ait vakaların hangi kısmı bu şekilde tanınır?
- özgüllük: Gerçekten C sınıfına ait olmayan vakaların hangi kısmı bu şekilde tanınır?
- pozitif öngörme değeri: Sınıflandırıcının C sınıfını öngördüğü göz önüne alındığında, bu tahminin doğru olma olasılığı nedir?
- negatif öngörü değeri: sınıflandırıcı Verilen durum olduğunu tahmin değil olasılık bu tahmin doğru olduğunu budur, form sınıfı C?
Bu sorular genellikle sınıflandırıcının faydalı olması için ihtiyaç duyduğu spesifikasyonların formüle edilmesine izin verir.
Tahmini değerler genellikle sınıflandırıcının pratik uygulaması açısından daha önemlidir: bunlar, sınıflandırıcıyı uygularken içinde bulunduğunuz durum olan tahmin üzerine koşullandırılır (bir hasta genellikle ne kadar olası olduğunu bilmekle ilgilenmez Test, hastalıklı vakaları tanımaktır, ancak belirtilen tanının ne kadar doğru olduğunu). Bununla birlikte, bunları doğru bir şekilde hesaplamak için, sınıflandırıcının kullandığı popülasyondaki farklı sınıfların göreceli frekanslarını bilmeniz gerekir (bu bilgilere sahip olduğunuz görülüyor - bu yüzden sizi buna bakmanızı engelleyen bir şey yok).
Ayrıca, olumlu veya olumsuz bir tahminin size sağladığı bilgi kazanımına da bakabilirsiniz. Bu pozitif ve negatif olabilirlik oranı, LRy ve LR⁻ ile ölçülür. Kısaca, tahminin söz konusu sınıfa karşı olasılıkları ne kadar değiştirdiğini size söylerler. ( daha ayrıntılı bir açıklama için cevabımı buraya bakın )
Önemsiz sınıflandırıcı için işler şöyle görünür: "0" sınıfını söz konusu sınıf olarak kullanacağım, bu yüzden "pozitif" sınıf "0" anlamına gelir. 100 vakadan 100'ünün pozitif olduğu tahmin edilmektedir (0 sınıfına aittir). 97'si gerçekten var, 3'ü yok. Sınıf 0 için duyarlılık% 100'dür (gerçekten sınıf 0'a ait 97 vakanın tamamı tanınmıştır), özgüllük 0'dır (diğer vakaların hiçbiri tanınmamıştır). pozitif prediktif değeri (97: 3 bağıl frekansın temsili olduğu varsayıldığında)% 97'dir, negatif tahmin değeri negatif tahmin olmadığı için hesaplanamaz.
LR,+=duyarlılık1 - özgüllük= 1
LR,-=1 - hassasiyetözgüllük=00
Şimdi LR⁺ ve LR⁻, davanın pozitif sınıfa ait olma olasılığını ("0") çarptığınız faktörlerdir. 1 LR⁺ değerine sahip olmak, pozitif tahminin size herhangi bir bilgi vermediği anlamına gelir: olasılıkları değiştirmez. Yani burada önemsiz sınıflandırıcınızın herhangi bir bilgi eklemediğini açıkça ifade eden bir önleminiz var .
Tamamen farklı düşünce yönü: Farklı sınıflandırıcıları değerlendirmek istediğinizden bahsediyorsunuz. Bu biraz sınıflandırıcı karşılaştırma veya seçim gibi geliyor. Yukarıda tartıştığım önlemlerle ilgili uyarı , "sert" sınıf etiketlerinde değerlendirirseniz , çok yüksek rastgele belirsizliğe (yani birçok test vakasına ihtiyacınız olduğu) maruz kalmalarıdır. Tahmininiz öncelikle süreklidir (metrik, örneğin arka olasılık), aynı tür sorulara bakan ancak vaka kesirleri yerine sürekli tedbirler kullanan ilgili önlemleri kullanabilirsiniz, buraya bakın . Bunlar ayrıca tahminlerdeki küçük farklılıkları tespit etmek için daha uygun olacaktır.
(@FrankHarrell size "uygun puanlama kurallarına" ihtiyacınız olduğunu söyleyecektir, bu nedenle akılda tutulması gereken bir başka arama terimi budur.)