Sınıflandırma için bir sinir ağı eğitmeye çalışıyorum, ancak sahip olduğum etiketler oldukça gürültülü (etiketlerin yaklaşık% 30'u yanlış).
Çapraz entropi kaybı gerçekten işe yarıyor, ama bu durumda daha etkili olan alternatifler olduğunu merak ediyordum. veya çapraz entropi kaybı optimal midir?
Emin değilim ama çapraz entropi kaybını "kırpma" düşünüyorum, böylece bir veri noktası kaybı bazı üst sınır daha büyük olmayacak, bu işe yarar?
Teşekkürler!
Güncelleme
Lucas'ın cevabına göre, tahmin çıktısı için türevler ve softmax fonksiyonunun z girişi için aşağıdakileri aldım . Yani aslında bir yumuşatma terimi ekliyor 3Türevlere 7 N. pi=0,3/N+0,7yil=-∑tigünlüğü(pi)∂l
Güncelleme Google tarafından Lucas'ın yanıtıyla aynı formülü uygulayan ancak farklı yorumlara sahip bir makale
okudum .
Bölüm 7'de Etiket Düzeltme ile Model Düzenleme
Ancak yumuşatma terimini tahminlere eklemek yerine, bunu gerçeğe eklediler , ki bu da yardımcı oldu.