Problem şu:
Çapraz entropi kaybı ile giriş -> gizli, gizli -> çıkış için sigmoid kullanarak tek bir gizli katman sinir ağı için giriş katmanına göre degradeyi türetin.
Zincir kuralını kullanarak türetmenin çoğunu geçebilirim ama onları nasıl "zincirleyeceğimiz" konusunda emin değilim.
Bazı gösterimleri tanımlayın
, sigmoid işlevidir
,
, softmax işlevidir
, gerçek etiket bir sıcak vektör
Sonra zincir kuralı ile,
Bireysel degradeler:
Şimdi tanımları birbirine zincirlemeliyiz. Tek değişkenli olarak bu kolaydır, her şeyi birlikte çarparız. Vektörlerde eleman-bilge çarpma veya matris çarpma kullanıp kullanmadığından emin değilim.
Burada vektörlerinin öğeye çoğalmasıdır ve bir matris çoklu olup. Bu işlem kombinasyonu, olması gerektiğini bildiğim boyut vektörü elde etmek için bunları bir araya getirmenin tek yolu .
Sorum şu: hangi operatörü kullanacağımı anlamanın ilk yolu nedir? Özellikle ve arasında element-bilge bir ihtiyaç ile karıştırılır .
Teşekkürler!