Şu anda, SGD
geri yayılım kullanan sinir ağları için , Stokastik Degrade İnişini uygulamak için çalışıyorum ve amacını anladığım sırada, öğrenme oranı için nasıl değer seçileceği konusunda bazı sorularım var.
- Öğrenme oranı, iniş oranını belirttiği için hata gradyanının şekliyle ilişkili midir?
- Eğer öyleyse, bu bilgiyi bir değer hakkında kararınızı bildirmek için nasıl kullanırsınız?
- Hangi tür değerleri seçmem gerekiyorsa ve bunları nasıl seçmeliyim?
- Görünüşe göre küçük değerlerin fazladan atlamaktan kaçınmasını istersiniz, ancak yerel minimumda sıkışıp kalmamanız veya inişin uzun sürmesi için nasıl birini seçersiniz?
- Sabit bir öğrenme oranına sahip olmak mantıklı mı yoksa degradedeki minimum seviyeye yaklaşırken değerini değiştirmek için bir ölçü mü kullanmalıyım?
Kısacası: SGD için öğrenme oranını nasıl seçerim?