Çıktı katmanında Çapraz Entropi veya Kütük Olasılığı


31

Bu sayfayı okudum: http://neuralnetworksanddeeplearning.com/chap3.html

ve çapraz entropili sigmoid çıkış katmanının log-olasılıklı softmax çıkış katmanına oldukça benzer olduğunu söyledi.

log katsayılı sigmoid veya çıktı katmanında çapraz entropi ile softmax kullanırsam ne olur? iyi mi? çünkü çapraz entropi arasındaki denklemde sadece küçük bir fark olduğunu görüyorum (eq.57):

C=1nx(ylna+(1y)ln(1a))

ve log olasılığı (eşd. 80):

C=1nx(lnayL)

Yanıtlar:


51

Negatif kütle olasılığı (eşd. 80) aynı zamanda iki farklı formülde olduğu gibi çok sınıflı çapraz entropi (ref: Örüntü Tanıma ve Makine Öğrenimi Bölüm 4.3.4) olarak da bilinir.

eq.57, Bernoulli dağılımının negatif kütük olasılığını gösterirken, eq.80, bir gözlemle (Bernoulli'nin çok sınıflı bir versiyonuyla) multinom dağılımının negatif kütük olasılığıdır.

İkili sınıflandırma problemleri için softmax fonksiyonu her sınıfın tahminini vermek için iki değer (0 ile 1 arasında ve toplamı 1'e kadar) verir. Sigmoid işlevi bir sınıfın (yani diğer sınıfın 1-p olduğu) tahminini vermek için bir değeri (0 ile 1 arasında) verir.

Bu nedenle eq.80, esas olarak eq.57 ile aynı kayıp olmasına rağmen, sigmoid çıktısına doğrudan uygulanamaz.

Ayrıca bu cevaba bakınız .


Aşağıda, ikili sınıflandırma problemleri için (sigmoid + ikili çapraz entropi) ve (softmax + çoklu sınıf çapraz entropi) arasındaki bağlantının basit bir örneği verilmiştir.

0.5

σ(wx+b)=0.5
wx+b=0

ew1x+b1ew1x+b1+ew2x+b2=0.5
ew1x+b1=ew2x+b2
w1x+b1=w2x+b2
(w1w2)x+(b1b2)=0

Aşağıdakiler, tezler kullanılarak elde edilen karar sınırlarını neredeyse aynı olan iki yöntemle göstermektedir.


Hangi denklemleri kastediyorsunuz? Kitapta, denklemler farklı numaralandırılmıştır. Belki kitabın belirli bir baskısıdır? Bunu açıklayabilir misin? Users.isr.ist.utl.pt/~wurmd/Livros/school/… , sayfa 209 (sayfa 4.3.4) adresindeki kitaba bakıyorum .
nbro

@ nbro ah karışıklık için üzgünüm, ben soruda verilen bağlantılı sayfadaki denklemleri kastettim.
dontloo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.