Doğruluk ile sorun
Standart doğruluk, doğru sınıflandırmaların, yapılan sınıflandırma sayısına oranı olarak tanımlanmaktadır.
accuracy:=correct classificationsnumber of classifications
Bu nedenle, tüm sınıflar üzerinde genel bir önlemdir ve kısaca göreceğimiz gibi, gerçek bir yararlı testten başka bir kehanete anlatmanın iyi bir önlem olmadığını görürüz. Bir kehanet, her örnek için rastgele bir tahmin döndüren bir sınıflandırma işlevidir. Aynı şekilde, sınıflandırma işlevimizin sınıflandırma performansını da derecelendirmek istiyoruz. Doğruluk \ textit {olabilir}, eğer sınıf başına aynı miktarda örneğe sahipsek, ancak dengesiz bir örneklem doğruluğuna sahipsek, hiç de faydalı olmaz. Daha da ötesi, bir test yüksek bir kesinliğe sahip olabilir, ancak aslında daha düşük bir kesinliğe sahip bir testten daha kötü bir performans sergileyebilir.
ABC0.9
classify(sample):={Aif ⊤
classify
classify(sample):=guess⎧⎩⎨ABCwith p =0.96with p =0.02with p =0.02
0.96⋅0.9+0.02⋅0.05⋅2=0.866Aclassify
Sınıf Başına Doğruluk
accuracy:=correct/(correct+incorrect)A1.00A0.331.000.00>0.5AABA
Hassasiyet ve özgüllük
Tıbbi testlerde duyarlılık, hastalığa sahip olduğu doğru tespit edilen kişiler ile hastalığa sahip olanların miktarı arasındaki oran olarak tanımlanır. Özgüllük, sağlıklı olarak doğru bir şekilde tanımlanmış insanlar ile gerçekten sağlıklı olan insanlar arasındaki oran olarak tanımlanır. Gerçekten hastalığı olan kişilerin miktarı, gerçek pozitif test sonuçlarının yanı sıra yanlış negatif test sonuçlarının miktarıdır. Aslında sağlıklı insanların miktarı gerçek negatif test sonuçlarının yanı sıra yanlış pozitif test sonuçlarının miktarıdır.
İkili Sınıflandırma
PNTnnFnn
sensitivity:=TPTP+FNspecificity:=TNTN+FP
TPFNTNFPαβαTααTα+FβαTβαTβ+FααββTββTβ+FαβTαβTα+Fβ
sensitivityα:=TαTα+Fβspecificityα:=TβTβ+Fαsensitivityβ:=TβTβ+Fαspecificityβ:=TαTα+Fβ
sensitivityα=specificityβspecificityα=sensitivityβ. Bunun anlamı, eğer sadece iki sınıfa sahipsek, sınıf başına duyarlılığa ve özgüllüğe ihtiyacımız yok demektir.
N-Ary Sınıflandırması
Sınıf başına duyarlılık ve özgüllük, yalnızca iki sınıfımız varsa kullanışsızdır, ancak bunu birden fazla sınıfa genişletebiliriz. Hassasiyet ve özgüllük şöyle tanımlanır:
sensitivity:=true positivestrue positives+false negativesspecificity:=true negativestrue negatives+false-positives
Tn∑i(Fn,i)∑i(Fi,n)n∑i(Ti)−T(n)nn∑i(∑k(Fi,k))nn∑i(Fn,i)n∑i(Fi,n)∑i(Ti)−T(n)+∑i(∑k(Fn,i))−∑i(Fn,i)−∑i(Fi,n). Özet olarak elimizde:
true positives:=Tntrue negatives:=∑i(Ti)−T(n)+∑i(∑k(Fn,i))−∑i(Fn,i)−∑i(Fi,n)false positives:=∑i(Fi,n)false negatives:=∑i(Fn,i)
sensitivity(n):=TnTn+∑i(Fn,i)specificity(n):=∑i(Ti)−Tn+∑i(∑k(Fi,k))−∑i(Fn,i)−∑i(Fi,n)∑i(Ti)−Tn+∑i(∑k(Fi,k))−∑i(Fn,i)
Güven Tanıtımı
confidence⊤Tn+∑i(Fi,n)nTn
confidence⊤(n):=TnTn+∑i(Fi,n)
confidence⊥nn
∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn∑i(Fn,i)
confidence⊥(n)=∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn−∑i(Fn,i)∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn