Andrew Ng'i (maalesef artık bulamadım bir videoda) derin öğrenme problemlerindeki yerel minima anlayışının şimdi daha az sorunlu olarak kabul edildikleri için nasıl değiştiği hakkında konuştuğunu duydum. derin öğrenme) kritik noktaların yerel minimadan ziyade eyer noktaları veya platolar olması daha olasıdır.
"Her yerel minimumun küresel bir minimum olduğu" varsayımlarını tartışan makaleler (örneğin bu ) gördüm . Bu varsayımların hepsi oldukça tekniktir, ancak anladığım kadarıyla sinir ağına biraz doğrusal hale getiren bir yapı dayatma eğilimindedirler.
Derin öğrenmede (doğrusal olmayan mimariler dahil) platoların yerel minimadan daha olası olduğu geçerli bir iddia mı? Ve eğer öyleyse, arkasında (muhtemelen matematiksel) bir sezgi var mı?
Derin öğrenme ve eyer noktaları hakkında özel bir şey var mı?