Yanıtlar:
Degradeleri yok etme veya degradeleri patlatma sorununu yaşarken degrade kırpma yapmak istersiniz. Ancak, her iki senaryo için de daha iyi çözümler vardır:
Patlayan degrade, degrade çok büyük olduğunda ve sayısal taşma olduğunda oluşur. Bu, ağın ağırlıkları daha küçük değerlere başlatılarak kolayca düzeltilebilir. Bu işe yaramazsa, kodda bir hata olması muhtemeldir.
Ufuk gradyanı, optimizasyon bir eyer noktasında sıkıştığında gerçekleşir, degrade optimizasyonun ilerlemesi için çok küçük olur. Bu, momentum veya RMS prop veya her ikisi ile de grad inişi kullanılarak (Adam optimizer olarak da bilinir) düzeltilebilir.
Degrade kırpmanın üst sınırı için başlangıç değerleri, değişkenin alabileceği en büyük sayıdan daha küçük bir şey olacaktır. Alt sınır için, probleme özgü olduğunu söyleyebilirim ama belki 1e-10 gibi bir şeyle başlayabilirim.