«gradient-descent» etiketlenmiş sorular

2
Ortalama kare hatası sinir ağları bağlamında her zaman dışbükey midir?
Birden fazla kaynak, MSE'nin dışbükey olduğu için harika olduğunu belirtmiştim. Ama nasıl olduğunu anlamıyorum, özellikle sinir ağları bağlamında. Diyelim ki aşağıdakiler var: XXX : eğitim veri kümesi YYY : hedefler ΘΘ\Theta : modelinin parametre seti ( doğrusal olmayan bir sinir ağı modeli)fΘfΘf_\Theta Sonra: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 Neden bu ...
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.