2
Ortalama kare hatası sinir ağları bağlamında her zaman dışbükey midir?
Birden fazla kaynak, MSE'nin dışbükey olduğu için harika olduğunu belirtmiştim. Ama nasıl olduğunu anlamıyorum, özellikle sinir ağları bağlamında. Diyelim ki aşağıdakiler var: XXX : eğitim veri kümesi YYY : hedefler ΘΘ\Theta : modelinin parametre seti ( doğrusal olmayan bir sinir ağı modeli)fΘfΘf_\Theta Sonra: MSE(Θ)=(fΘ(X)−Y)2MSE(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 Neden bu …