Stanford NLP derin öğrenme sınıfının yazılı ödev problemlerindeki problemleri yaşıyorum http://cs224d.stanford.edu/assignment1/assignment1_soln
3a'nın cevabını anlamaya çalışıyorum, burada orta kelime için vektörün türevini arıyorlar.
Tahmin edilen bir kelime vektörü verildiğini varsayın skipgram için orta kelimeye c karşılık gelir ve word2vec modellerinde bulunan softmax fonksiyonu ile kelime tahmini yapılır.
Burada ağırlık anlamına gelir w-inci kelime ve(w = 1,.., W) sözcük dağarcığındaki tüm kelimeler için “çıktı” sözcük vektörleridir. Bu öngörüye çapraz entropi maliyetinin uygulandığını ve o kelimesinin beklenen kelime olduğunu varsayalım .
Nerede tüm çıkış vektörlerinin matrisidir ve kelimelerin softmax tahmininin sütun vektörü ve y de bir sütun vektörü olan tek sıcak etiket olmalıdır.
Çapraz entropi nerede
Yani merkez vektör için gradyanın cevabı
Birisi bana bunun için gerekli adımları gösterebilir mi? Bu soruyu referans olarak kullanıyorum word2vec'deki çapraz entropi kaybının türevi ama özellikle temsilidir.