Word2vec'de çapraz entropi kaybının türevi


10

Ben cs224d çevrimiçi stanford sınıfı ders materyali ilk sorun seti ile yoluma çalışıyorum ve sorun 3A ile bazı sorunlar yaşıyorum: Softmax tahmin fonksiyonu ve çapraz entropi kaybı fonksiyonu ile atlama gram word2vec modeli kullanırken, biz degradeleri tahmin edilen sözcük vektörlerine göre hesaplamak istiyorum. Softmax fonksiyonu göz önüne alındığında:

wben^=Pr(wÖrdben|r^,w)=tecrübe(wbenTr^)Σj|V|exp(wjTr^)

ve çapraz entropi fonksiyonu:

CE(w,w^)=-ΣkwklÖg(wk^)

\ frac {\ partial {CE}} {\ partial {\ hat {r}}} hesaplamamız gerekiyorCEr^

Adımlarım aşağıdaki gibidir:

CE(w,w^)=-Σk|V|wklÖg(tecrübe(wkTr^)Σj|V|exp(wjTr^))

=-Σk|V|wklÖg(tecrübe(wkTr^)-wklÖg(Σj|V|exp(wjTr^))

şimdi verilen wk sıcak bir vektör ve ben doğru sınıf:

CE(w,w^)=-wbenTr^+lÖg(Σj|V|exp(wjTr^))

CEr^=wi+1j|V|exp(wjTr^)j|V|exp(wjTr^)wj

Bu doğru mu yoksa daha basitleştirilebilir mi? Sorun seti çözümleri çevrimiçi olarak yayınlanmadığından doğru yolda olduğumdan emin olmak istiyorum. Ayrıca, yazılı ödevleri doğru yapmak, programlama ödevlerini doğru bir şekilde yapabilmek için önemlidir.


Lütfen soruya kendi kendine çalışma etiketini ekleyin
Dawny33

İlk günlük kimliğinde 2. eksi işareti artı olmalıdır. Sizin için düzeltmeye çalıştım, ancak düzenlemelerin en az 6 karakter olması gerekiyor: \
FatalMojo

Yanıtlar:


7

CEr^=-wben+1Σj|V|exp(wjTr^)Σj|V|exp(wjTr^)wj
olarak yeniden yazılabilir dikkat edin, toplamların her ikisi de j ile indekslenir, ancak gerçekten 2 farklı değişken olmalıdır. Bu daha uygun çevirir
CEr^=-wben+Σj|V|(tecrübe(wjr^)Σj|V|exp(wjTr^)wj)
CEr^=-wben+Σx|V|(tecrübe(wxr^)Σj|V|exp(wjTr^)wx)
CEr^=-wben+Σx|V|Pr(wÖrdx|r^,w)wx

1
Alakalı, o ders 2'de ayrıntılı olarak türetme gider @ 38:00
FatalMojo

Toplamlar neden farklı değişkenler tarafından endekslenmeli?
Yamaneko

1
Sadece karışıklığı önlemek için. Matematiksel olarak aynı anlama gelir, ancak yeni bir toplam eklerken dizin etiketini değiştirmek iyi bir uygulamadır.
FatalMojo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.