Armijo kuralı hakkında karışıklık


13

Satır aramada kullanılan Armijo kuralı hakkında bu karışıklık var. İzleme hattı aramasını tekrar okuyordum ama bu Armijo kuralının ne hakkında olduğunu anlamadım. Herkes Armijo kuralının ne olduğunu açıklayabilir mi? Vikipedi iyi açıklamıyor gibi görünüyor. Teşekkürler


Denklemde x değişkeni bir vektör değil bir matris ise ne olur? Armijo kuralı nasıl güncellenmelidir?
Frank Puk

hiçbirşey değişmez. matrisinizi bir (sütun) vektörü x k şeklinde yeniden şekillendirmeniz gerekir . Xkxk
GoHokies

Takıldığım yer burası. Tüm bir matris haline, sol taraftaki değeri ( f ( x k + α p k ) ), yine de bir skalerdir. Ancak sağ taraftaki değer değil - bunun yerine, bir matris ( f ( x k ) bir skaler ve β α f ( x k ) T p k bir matristir.)xkf(xk+αpk)f(xk)βαf(xk)Tpk
Frank Puk

N×NXkxkN2N2

Yanıtlar:


19

pf(x)

f

f(xk+αpk)f(xk)+βαf(xk)Tpk
pkxkβ(0,1)

f(xk+αpk)xkpk


1
βα

Bunun önemli olmasının nedeni, yani "iyi" bir adımın neden gerekli olduğu, Paul'ün dediği gibi birçok optimizasyon şemasının daha yavaş birleşeceği veya hiç birleşmeyebileceğidir. Bu nedenle, çeşitli çeşitlerde gelen hat aramaları, Armijo sadece en popüler olanıdır - algoritmalara daha sağlam yakınsama özellikleri vermek için kullanılabilir.
cjordan1

1
Paul: Açıklamanız eksik. Bu eşitsizlik tek başına 'yeterli' düşüşü garanti etmez. Aslında, alfa = 0 olabilir ve yine de yazdığınız eşitsizliği karşılarsınız. Önemli bir özellik Armijo kuralı, adım boyutunu sıfırdan uzağa bağlamaktır, bu da başka bir eşitsizlikle yapılır: f (gama * x_new) -f (x_old)> beta * (gama * x_new-x_old) ^ T * grad (f (x_old))

f(x)=x2xk=1pk=2αf(xk+αpk)α=1/2β>1/2f(xk+1/2pk)=0>12β=f(xk)+βαf(xk)pkβ

β>1/2β=104β

0

Beş yıl sonra bu soru hala geçerli.

Burada (sayfa 16 ve 17) bir Algoritma da dahil olmak üzere harika bir açıklama bulabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.