Sinir ağlarının başlangıç ağırlıkları neden rastgele sayılar olarak başlatıldı? Bir yerde bunun simetriyi kırmak için yapıldığını okumuştum ve bu sinir ağının daha hızlı öğrenmesini sağlıyor. Simetriyi kırmak nasıl daha hızlı öğrenmesini sağlar?
Ağırlıkları 0'a başlatmak daha iyi bir fikir olmaz mıydı? Bu şekilde ağırlıklar (pozitif veya negatif olsun) değerlerini daha hızlı bulabilir mi?
Başlatıldıklarında optimum değerlerine yakın olmaları umuduyla ağırlıkların rastgele dağıtılmasının ardında yatan başka bir felsefe var mı?