0-1 Kayıp İşlevi açıklaması


19

Kayıp fonksiyonunun amacının ne olduğunu kavramaya çalışıyorum ve bunu tam olarak anlayamıyorum.

Yani, anladığım kadarıyla kayıp fonksiyonu, yanlış bir kararın "maliyetini" ölçebileceğimiz bir tür metrik sunmaktır.

Diyelim ki 30 nesne veri setim var, bunları 20/10 gibi eğitim / test setlerine böldüm. 0-1 kayıp işlevini kullanacağım, bu yüzden sınıf etiketleri setimin M olduğunu ve işlev şöyle görünüyor :

L(i,j)={0i=j1iji,jM

Bu yüzden eğitim verilerim üzerinde bir model oluşturdum, diyelim ki Naive Bayes sınıflandırıcısını kullanıyorum ve bu model 7 nesneyi doğru bir şekilde sınıflandırdı (onlara doğru sınıf etiketleri verildi) ve 3 nesne yanlış sınıflandırıldı.

Kayıp fonksiyonum 7 kez "0" ve 3 kez "1" döndürür - bundan ne tür bilgiler alabilirim? Modelim nesnelerin% 30'unu yanlış sınıflandırdı mı? Yoksa daha fazlası var mı?

Düşünme biçimimde herhangi bir hata varsa çok üzgünüm, sadece öğrenmeye çalışıyorum. Eğer verdiğim örnek "çok soyut" ise, bana bildirin, daha spesifik olmaya çalışacağım. Farklı bir örnek kullanarak kavramı açıklamaya çalışacaksanız, lütfen 0-1 kayıp fonksiyonunu kullanın.

Yanıtlar:


14

0-1 kayıp fonksiyonunu isabetli bir şekilde etkili bir şekilde inceleyerek doğru bir şekilde özetlediniz. 1'leriniz, nasıl yanlış sınıflandırıldıklarına bakılmaksızın, yanlış sınıflandırılan öğeler için gösterge haline gelir. Her 10 öğeden üçü 1 olduğundan, sınıflandırma doğruluğunuz% 70'dir.

Kayıp fonksiyonu üzerindeki ağırlığı değiştirirseniz, bu yorum artık geçerli değildir. Örneğin, hastalık sınıflandırmasında, pozitif bir hastalık vakasını (yanlış negatif) kaçırmak, hastalığı yanlış teşhis etmekten (yanlış pozitif) daha pahalı olabilir. Bu durumda, kayıp fonksiyonunuz yanlış negatif yanlış sınıflandırmayı daha ağır hale getirir. Kayıplarınızın toplamı artık bu durumda doğruluğu değil, yanlış sınıflamanın toplam "maliyetini" temsil eder. 0-1 kayıp işlevi, doğrulukla eşdeğerliği bakımından benzersizdir, çünkü tek dikkat ettiğiniz şey, onu doğru yapıp yapmadığınızdır ve hataların nasıl yapıldığına değil.


İstatistikte accurracy tanımıdır @JohnnyJohansson, bkz en.wikipedia.org/wiki/Sensitivity_and_specificity
Tim

@Tim - Hala 0-1 kayıp fonksiyonu ile karıştırıyorum - ortaya çıkan matris 1'den büyük herhangi bir değere sahip olabilir, yani 3 özledim sınıflandırması varsa, ilgili girişte 3 değerini görebilir miyiz? bkz. math.stackexchange.com/questions/2623072/…
Xavier Bourret Sicotte


0

Bence karışıklığınız bir veri noktasının kaybını ve tüm veri kümesinin kaybını ayırt etmiyor.

L(y,y^)

iL(yi,y^i)

Aslında farkı alıyorum, ancak tüm veri kümesi için kaybı hesaplamak dışında bir veri noktası için bu kaybı neye ihtiyaç duyacağımı anlamak benim için zor mu? Ve belirli bir sorun için yeterli kayıp fonksiyonunu seçerken nelere dikkat etmeliyim?
Johnny Johansson
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.