BFGS'nin türetilmesi, (kesinlikle) dışbükey maliyet fonksiyonlarını düşündüğünde daha sezgiseldir:
Yaklaşık bir çözüm olduğunu varsayalım x k . Daha sonra, f'nin minimum değeri kesilmiş Taylor genişlemesinin minimum
f ( x k + p ) ≈ f ( x k ) + ∇ f ( x k ) T p + 1'e yaklaşır.
f( x ) → dkx ∈ Rn.
xkf
Yani için bir görünüm olduğu
p öyle ki
( * ) az ve setleri
x k + 1 : = x k + p .
( ∗ ) - "nin
p'ye göre"eğrisini hesaplamak vesıfıra ayarlamak
H ( x k ) [ x k + 1 - x k ] = ∇ f ( x k + 1 ) - ilişkisini verir
f( xk+ p ) ≈ f( xk) + ∇ f( xk)Tp + 12pT'H( xk) s .( ∗ )
p( ∗ )xk + 1: = xk+ p( ∗ )p
buradaki
H , 'gradyanın Jacobianı' veya Hessian matrisidir.
'H( xk) [ xk + 1- xk] = ∇ f( xk + 1) - ∇ f( xk) ,
'H
Hessian'ın hesaplanması ve ters çevrilmesi pahalı olduğu için ...
... kısa bir cevap
(Broyden en güncelleme karşılaştırınız) olabileceğini BFGS güncelleme minimize
‖ H - 1 k - H - 1 ‖ W
bir akıllıca ağırlıklı seçilenin Frobemino normunda, konu'H- 1k + 1
∥ H- 1k- H- 1∥W
- 'H[ xk + 1- xk] = ∇ f( xk + 1) - ∇ f( xk)
- 'HT= H
W∥ H∥W: = ∥ W1 / 2'HW1 / 2∥F
G : = ∫10'H( xk+ τp ) dταk= 1
Önemli noktalar:
- İkinci dereceden bir yaklaşım için çözüm tarafından fiili maliyetlerin çözümüne yaklaşmaya çalışır
- Hessian'ın hesaplanması ve tersi pahalıdır. Biri basit güncellemeleri tercih eder.
- Güncelleme gerçek Hessian yerine tersi için en uygun seçilmiştir .
- Bunun bir rank-2 güncellemesi olması, Frobenius normundaki ağırlıkların belirli seçiminin bir sonucudur.
p