101 hesabında "analitik yöntem" kullanarak bir fonksiyonun nasıl optimize edileceğini öğrendik: sadece maliyet fonksiyonunun türevini almamız ve türevi 0'a ayarlamamız ve denklemi çözmemiz gerekiyor. Bu gerçekten bir oyuncak problemidir ve neredeyse hiçbir zaman gerçek dünyada olmayacaktır.
Gerçek dünyada, birçok maliyet fonksiyonunun her yerde türevi yoktur (Dahası, maliyet fonksiyonu ayrık olabilir ve hiç türevi olmayabilir). Ek olarak, türevi bile hesaplayabilirseniz, denklemi analitik olarak çözemezsiniz (örneğin, nasıl çözüleceğini düşünebilirsiniz)x7+x3-52+ex+ l o g( x +x2) + 1 / x = 0analitik? Size sayısal cevabınx = 1.4786, ancak analitik çözüm bilmiyorum). Bazı sayısal yöntemler kullanmalıyız (burada polinom olgularında neden Abel Ruffin Teoremi'ni kontrol edin ).
Yinelemeli yöntemlerin kullanımı harika ve anlaşılması çok sezgisel. Bir işlevi optimize etmek istediğinizi varsayalım, bir denklemi çözmek ve cevabı almak yerine, cevabınızı yeterli yinelemeden sonra yineleme / adım sayısına göre geliştirmeye çalışıyorsunuz, cevabı "gerçek cevaba" yakın alacaksınız. En aza indirmek için kalkülüs kullanıyorsanızf( x ) =x2, doğrudan alırsın x = 0, ancak sayısal yöntemler kullanarak, x = 1,1234 ×10- 20.
Şimdi, bu yinelemeli yöntemlerin nasıl çalıştığını anlamak önemlidir. Anahtar kavram, daha iyi bir çözüm elde etmek için giriş parametrelerinizi nasıl güncelleyeceğinizi bilmektir. En aza indirmek istediğinizi varsayalımf(x1,x2) =x21+x22+ |x1+x2| (bu maliyet işlevinin her yerde farklılaştırılamadığını, ancak "çoğu yerde" farklılaşabileceğini unutmayın, "çoğu yerde" nasıl güncelleyeceğimizi bildiğimiz için bu bizim için yeterince iyidir.) ( 1 , 1 )ve maliyeti 4,0, şimdi güncellemek istiyorsun (x1,x2)nesnel işlevi küçültmek. Bunu nasıl yaptın? Her ikisini de azaltmak istediğimi söyleyebilirsinx1 x2, ama neden? Aslında , degrade kavramını kullanarak ,x, ne olacak y". . Gelen( 1 , 1 ), türev ( 3 , 3 ), öylesine olumsuz degrade kez bir öğrenme oranı α = 0.001, dır-dir ( - 0.003 , - 0.003 ), bu nedenle çözümümüzü 1 , 1 için ( 0.997 , 0.997 ) hangi daha iyi maliyet var.