Geri yayılım algoritması için momentum terimi nasıl çalışır?


9

Bir sinir ağının ağırlıklarını bir momentum terimiyle backpagagation algoritmasını kullanarak güncellerken, öğrenme hızı momentum terimine de uygulanmalı mıdır?

Momentum kullanımıyla ilgili bulabildiğim bilgilerin çoğu, aşağıdaki gibi görünen denklemlere sahiptir:

Wi=WiαΔWi+μΔWi1

nerede α öğrenme oranıdır ve μ momentum terimi.

Eğer μ terim, α terim sonra bir sonraki yinelemede ΔW önceki iterasyondan ağırlık üzerinde mevcut olandan daha büyük bir etkiye sahip olacaktır.

Bu momentum teriminin amacı mıdır? ya da denklem daha böyle mi görünmeli?

Wben'=Wben-α(ΔWben+μΔWben-1)

yani. her şeyi öğrenme oranına göre ölçeklendirmek?

Yanıtlar:


10

Backpropagation'ı bir ağda momentumla kullanma n farklı ağırlıklar Wk ben-ağırlık düzeltme Wk tarafından verildi

ΔWk(ben)=-αEWk+μΔWk(ben-1) nerede EWk kayıp wrt varyasyonu Wk.

Momentum hızının eklenmesi, gradyan inişindeki salınımların zayıflamasına izin verir. Bu fikrin arkasındaki geometrik fikir muhtemelen en iyi lineer durumda bir eigenspace analizi açısından anlaşılabilir. En düşük ve en büyük özdeğer arasındaki oran büyükse, matrisin koşullandırılmasından dolayı öğrenme oranı büyük olsa bile gradyan iniş yapmak yavaştır. Momentum, daha düşük ve daha büyük özdeğerlerle ilişkili özvektörler arasındaki güncellemede bazı dengeleme sağlar.

Daha fazla ayrıntı için

http://page.mi.fu-berlin.de/rojas/neural/chapter/K8.pdf


Underbrace ne anlama geliyor?
David Richerby

tamam, yani momentum terimi hesaplanırken ΔWkterim, "yeni" ağırlık değeri hesaplanırken eklendi? Sadece açıklığa kavuşturmak için, teriminizμWk(ben-1) olmak μΔWk(ben-1)? veya orandaki değişiklikten ziyade gerçek ağırlığın bir oranı mı? Yanıtınız ve makaleye bağlantı için teşekkürler.
guskenny83

hatayı işaret ettiğiniz için teşekkür ederim. Tabii kiΔWk(ben-1)
nico

"Kaybın değişimi" ile ne demek istiyorsun? "Hatadaki varyasyon" gibi bir şey mi?
starbeamrainbowlabs

Ağırlıklar açısından hatanın türevi dışında hiçbir şey ifade etmez.
nico
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.