BFGS güncellemesi için sezgisel motivasyon


15

Sayısal bir analiz anketi dersi veriyorum ve optimizasyonda sınırlı geçmişi / sezgisi olan öğrenciler için BFGS yöntemi için motivasyon arıyorum!

J k ( x k - x k - 1 ) = f ( x k ) - f ( x k - 1 )JkJk1Fro2Jk(xkxk1)=f(xk)f(xk1)

BFGS güncellemelerinin türevleri çok daha karmaşık ve bulanık görünüyor! Özellikle, varsaymak değil istiyorum önsel güncelleme rütbe-2 olmak veya belirli bir formu geçmesi gerektiğini söyledi. Broyden için olduğu gibi BFGS Hessian güncellemesi için kısa bir varyasyon görünümlü motivasyon var mı?


4
İsteğe bağlı bir güncellemeye izin verirseniz, tam Hessian'ı Newton yönteminde kullanabilirsiniz. Düşük seviyeli bir güncellemenin önemli bir hesaplama avantajı, yaklaşık Hessian'ın çarpanlarına ayırmasını çok hızlı bir şekilde güncellemenize izin vermesidir.
Brian Borchers

Yanıtlar:


12

BFGS'nin türetilmesi, (kesinlikle) dışbükey maliyet fonksiyonlarını düşündüğünde daha sezgiseldir:

Yaklaşık bir çözüm olduğunu varsayalım x k . Daha sonra, f'nin minimum değeri kesilmiş Taylor genişlemesinin minimum f ( x k + p ) f ( x k ) + f ( x k ) T p + 1'e yaklaşır.

f(x)minxR,n.
xkf Yani için bir görünüm olduğu p öyle ki ( * ) az ve setleri x k + 1 : = x k + p . ( ) - "nin p'ye göre"eğrisini hesaplamak vesıfıra ayarlamak H ( x k ) [ x k + 1 - x k ] = f ( x k + 1 ) - ilişkisini verir
f(xk+p)f(xk)+f(xk)Tp+12pT'H(xk)p.(*)
p(*)xk+1: =xk+p(*)p buradaki H , 'gradyanın Jacobianı' veya Hessian matrisidir.
'H(xk)[xk+1-xk]=f(xk+1)-f(xk),
'H

Hessian'ın hesaplanması ve ters çevrilmesi pahalı olduğu için ...


... kısa bir cevap

(Broyden en güncelleme karşılaştırınız) olabileceğini BFGS güncelleme minimize H - 1 k - H - 1W bir akıllıca ağırlıklı seçilenin Frobemino normunda, konu'Hk+1-1

'Hk-1-'H-1W
  1. 'H[xk+1-xk]=f(xk+1)-f(xk)
  2. 'HT='H

W'HW: =W1/2'HW1/2F G,: =01'H(xk+τp)dταk=1

Önemli noktalar:

  • İkinci dereceden bir yaklaşım için çözüm tarafından fiili maliyetlerin çözümüne yaklaşmaya çalışır
  • Hessian'ın hesaplanması ve tersi pahalıdır. Biri basit güncellemeleri tercih eder.
  • Güncelleme gerçek Hessian yerine tersi için en uygun seçilmiştir .
  • Bunun bir rank-2 güncellemesi olması, Frobenius normundaki ağırlıkların belirli seçiminin bir sonucudur.

p


WW

Evet doğru. Bilmiyorum. Bir cevap, hesaplaması kolay ve iyi çalışan güncelleme formülü vermesidir. Tarihsel olarak, bu güncelleme yaklaşımı - güncelleme farkını en aza indirgemek - Shanno'nun yaklaşımıydı. Ağırlıkların belirli bir seçiminin Broyden ve Fletcher'ın formülüne yol açtığını tespit eden bir hakemdi (Goldfarb). Doktora tezine bakın BFGS geliştiricilerinin sezgileri için BFGS sekant yönteminin tarihsel gelişimi . Bununla birlikte, 3 yaklaşımın hepsi oldukça soyuttur.
Ocak

1
İlginç, rehberlik için teşekkürler! Benim mevcut yazma (yardıma ihtiyacı olan bazı matematik hataları ile) burada: graphics.stanford.edu/courses/cs205a-13-fall/assets/notes/… (yardımınız için kredi istiyorsanız bunu sağlamaktan mutluluk duyuyorum - lütfen uygun iletişim bilgileriyle bana e-posta gönderin)
Justin Solomon

'H(xk)[xk+1-xk]=f(xk+1)-f(xk)
'H(xk+1)[xk+1-xk]=f(xk+1)-f(xk)?
'Hk+1sk=yksk=xk+1-xk,yk=fk+1-fk
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.