Geri yayılım algoritmasını kullanarak bir sinir ağını eğitirken, ağırlık güncellemelerini belirlemek için degrade iniş yöntemi kullanılır. Benim soru: Daha çok yavaş belirli ağırlığına göre en az noktasını bulmak için dik iniş metodunu kullanarak yerine, neden türevi set değil , ve hatayı en aza indiren ağırlık değerini bulun.w
Ayrıca, geri yayılımdaki hata fonksiyonunun minimum olacağından neden eminiz? Bunun yerine hata fonksiyonunun maksimum olduğu ortaya çıkamaz mı? Sıkıştırma ağırlıklarının ve giriş vektörlerinin olduğu herhangi bir sayıda gizli düğüme sahip bir ağın her zaman bazı minimum değerleri olan bir hata işlevi vermesini garanti eden squashing işlevlerinin belirli bir özelliği var mı?