TL; DR
Doğruluk yanlış bir puanlama kuralıdır. Kullanma.
Biraz daha uzun versiyon
Aslında doğruluk bir puanlama kuralı bile değildir. Bu yüzden (kesinlikle) uygun olup olmadığını sormak bir kategori hatasıdır. Söyleyebileceğimiz en fazla şey, ek varsayımlar altında doğruluğun uygunsuz, süreksiz ve yanıltıcı olan bir puanlama kuralıyla tutarlı olduğudur. (Kullanma.)
Karışıklık
Karışıklıklarınız, alıntıladığınız kağıda göre yanlış sınıflandırma kaybının da bir puanlama kuralı olmaması gerçeğinden kaynaklanmaktadır.
Ayrıntılar: Puanlama kuralları ve sınıflandırma değerlendirmeleri
Terminolojiyi düzeltelim. Bir ikili sonuç ilgilenen ve bir olasılık tahmini sahip q = P ( Y = 1 ) ∈ ( 0 , 1 ) . Bunu biliyoruz P ( Y = 1 ) = η > 0.5 , ama örnek q ya da bilmiyor olabilir.y∈ { 0 , 1}qˆ=Pˆ(Y= 1 ) ∈ ( 0 , 1 )P(Y= 1 )=η> 0.5qˆ
Bir puanlama kuralı bir olasılık tahmini alan bir eşleme q ve bir sonuç y , kaybınaqˆy
s : ( qˆ, y) ↦ s ( qˆ, y) .
olanuygunbu göre beklenti en iyi olup olmadığını q = η . (Genellikle "minimize" anlamına gelen "Optimize", ancak bazı yazarlar çevirme işaretler ve bir puanlama kuralı maksimize etmek deneyin.) S olansıkı uyguno beklenti eniyilendirilmiş isesadecetarafından q = η .sqˆ= ηsqˆ= η
Normal olarak, değerlendirecek birçok tahminler ile q i ve sonuçlarını karşılık gelen y ı ve ortalama Bu beklenti tahmin etmek.sqˆbenyben
Şimdi, doğruluk nedir? Doğruluk, bir argüman olarak olasılıklı bir tahminde bulunmaz. Bu sınıflandırma alır y ∈ { 0 , 1 }yˆ∈{0,1} ve bir sonuç:
a : ( yˆ, y) ↦ a ( yˆ, y) = { 1 ,0 ,yˆ= yyˆ≠ y.
Bu nedenle, doğruluk bir puanlama kuralı değildir . Bu bir sınıflandırma değerlendirmesidir. (Bu yeni icat ettiğim bir terimdir, literatürde aramayın.)
Şimdi, tabii ki bizim gibi bir olasılık tahmini alabilir q ve bir sınıflandırma çevirmek y . Ancak bunu yapmak için, yukarıda belirtilen ek varsayımlara ihtiyacımız olacak. Örneğin, bir eşik θ kullanmak ve sınıflandırmak çok yaygındır :qˆyˆθ
yˆ( qˆ, θ ) : = { 1 ,0 ,qˆ≥ θqˆ< θ .
θ = 0.5qˆbenyben
qˆqˆyˆ= yˆ( qˆ, θ )qˆ
qˆ= ηθ = 0.5qˆ∈ ( 0 , 1 )
yˆqˆ
qˆ≥ θθ = 0.5qˆ= 0,99qˆ≥ θqˆη
θ = 0.2y= 1y= 0qˆqˆ= 0.25qˆ≥ θ
Bu nedenle, doğruluk veya yanlış sınıflandırma kaybı yanıltıcı olabilir.
Buna ek olarak, doğruluk ve yanlış sınıflandırma kaybı olan sonuçların IID edilmez daha karmaşık durumlarda ek varsayımlar altında uygunsuz. Frank Harrell, onun blog yazısı içinde Sınıflandırma Doğruluğu ve Diğer süreksiz Yanlış Doğruluk Puanlama Kuralları Neden Olduğu Hasarın onlar olduğundan, bir misspecified modeline yol açacaktır doğruluğu veya yanlış sınıflandırma kaybı kullanarak bir kitabında bir örnek değinir değil doğru koşullu yordayacak tarafından optimize olasılık.
θ
Daha fazla bilgi için Neden sınıflandırma modellerini değerlendirmede doğruluk en iyi ölçü değildir? .
Alt çizgi
Doğruluk kullanmayın. Ne de yanlış sınıflandırma kaybı.
Nitpick: "katı" ile "katı"
"Katı" doğru puanlama kurallarından mı yoksa "katı" doğru puanlama kurallarından mı bahsetmeliyiz? "Katı", "puanlama kuralı" nı değil, "uygun" u değiştirir. ("Uygun puanlama kuralları" ve "kesinlikle doğru puanlama kuralları" vardır, ancak "katı puanlama kuralları" yoktur.) Bu nedenle, "kesinlikle" bir sıfat değil, bir sıfat değil ve "kesinlikle" kullanılmalıdır. Literatürde daha yaygın olduğu gibi, örneğin Tilmann Gneiting'in makaleleri.