Çapraz entropi kaybı fonksiyonunun farklı tanımları


12

Nöral ağlar ve derin öğrenme noktaları com öğretici ile sinir ağlarını öğrenmeye başladım. Özellikle 3. bölümde çapraz entropi fonksiyonu hakkında bir bölüm vardır ve çapraz entropi kaybını şu şekilde tanımlar:

C=1nxj(yjlnajL+(1yj)ln(1ajL))

Bununla birlikte, Tensorflow girişini okurken, çapraz entropi kaybı şöyle tanımlanır:

C=1nxj(yjlnajL) (yukarıdakiyle aynı sembolleri kullanırken)

Sonra neler olup bittiğini bulmak için arama yaparken başka bir not kümesi buldum: ( https://cs231n.github.io/linear-classify/#softmax-classifier ) çapraz entropi kaybının tamamen farklı bir tanımını kullanan bu sinir ağı yerine softmax sınıflandırıcısının zamanı.

Birisi bana burada neler olduğunu açıklayabilir mi? Neden btw tutarsızlıkları var? çapraz entropi kaybını ne tanımlar? Sadece kapsayıcı bir prensip var mı?


Yanıtlar:


18

Bu üç tanım aslında aynıdır.

1) Tensorflow tanıtımı ,

C=1nxj(yjlnaj).

2) ikili sınıflandırmaları için, ve ve , 3. bölümdeki ile aynı olan olarak yeniden yazılabilir . .j=2

C=1nx(y1lna1+y2lna2)
jaj=1jyj=1
C=1nx(y1lna1+(1y1)ln(1a1))

3) Dahası, , tek sıfırdan oluşan bir vektör ise (genellikle sınıflandırma etiketleri için de geçerlidir) ve yalnızca sıfır olmayan , karşılık gelen örneğin çapraz entropi kaybı yyk

Cx=j(yjlnaj)=(0+0+...+yklnak)=lnak.

Gelen cs231 notlar , bir numunenin çapraz entropi kaybı olarak SoftMax normalleştirme ile birlikte verilir

Cx=ln(ak)=ln(efkjefj).

0

Olarak , üçüncü bölümde , denklem (63), birden çok sigmoidleri uygulanan çapraz entropi (yani 1 toplamı değil) ise bir giriş Tensoflow çapraz entropi bir SoftMax çıkış tabakası üzerinde hesaplanır.

Dontloo tarafından açıklandığı gibi, her iki formül de iki sınıf için eşdeğerdir, ancak ikiden fazla sınıf dikkate alındığında değildir. Softmax, özel sınıflara sahip çoklu sınıflar için anlamlıdır ( örn. , Örnek başına yalnızca bir etiket olduğunda, etiketlerin bir kez sıcak kodlanmasına izin veren), çok etiketli bir sorunu (yani muhtemelen pozitif olan örneklerle) tanımlamak için kullanılabilir (çoklu) sigmoidler birkaç sınıf için).

Diğer dontloo cevaplarını da görün .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.