[Not 5 Nisan 2019: Makalenin arXiv'de yeni bir versiyonu birçok yeni sonuçla güncellendi. Ayrıca Momentum ve NAG'ın backtracking sürümlerini tanıtıyoruz ve Backtracking Gradient Descent ile aynı varsayımlar altında yakınsamayı kanıtlıyoruz.
Kaynak kodları GitHub'da şu adreste bulabilirsiniz: https://github.com/hank-nguyen/MBT-optimizer
DNN'ye uygulamak için algoritmaları geliştirdik ve MMT, NAG, Adam, Adamax, Adagrad, vb.Gibi son teknoloji algoritmalardan daha iyi performans elde ettik ...
Algoritmalarımızın en özel özelliği otomatik olmalarıdır, ortak uygulama olarak öğrenme oranlarının manuel olarak ince ayarını yapmanıza gerek yoktur. Otomatik ince ayarımız doğada Adem, Adamax, Adagrad, vb. Daha fazla ayrıntı makalede bulunmaktadır.
]
Çok yakın tarihli sonuçlara dayanarak: Bu makaledeki ortak çalışmamda https://arxiv.org/abs/1808.05160
f
Yukarıdakilere dayanarak, derin öğrenmede, mevcut en yeni yöntemlerle eşit olan ve öğrenme oranlarının manuel olarak ayarlanmasını gerektirmeyen yeni bir yöntem önerdik. ( Kısacası , fikir, her bir iterasyonla değişen öğrenme oranlarının stabil hale geldiğini görene kadar, belirli bir süre geri izleme gradyanı inişini çalıştırmanızdır. Bu istikrarı, özellikle de C ^ 2 ve dejenere değil, yukarıda bahsettiğim yakınsama sonucu nedeniyle, bu noktada, standart gradyanlı iniş yöntemine geçersiniz.Daha fazla ayrıntı için lütfen belirtilen kağıda bakınız.Bu yöntem diğer optimal algoritmalara da uygulanabilir .)
Not: Standart degrade iniş yöntemi hakkındaki orijinal sorunuzla ilgili olarak, sadece haritanın türevinin küresel olarak Lipschitz olduğu ve öğrenme hızının standart degrade iniş yönteminin birleştiği kanıtlanmış olduğu durumda bildiklerime kadar. [Bu koşullar yerine getirilmezse, hiçbir yakınsama sonucunun mümkün olmadığını gösteren basit karşı örnekler vardır, bazıları için alıntı yapılan makaleye bakın.] Yukarıda belirtilen makalede, uzun vadede geri izleme degrade iniş yönteminin standart gradyan iniş yöntemi, pratikte standart gradyan iniş yönteminin neden genellikle iyi çalıştığını açıklayan bir açıklama verir.