Egzersiz kaybı zamanla artar [çift]


21

4 tip diziyi sınıflandırmak için bir model (Tekrarlayan Sinir Ağı) eğitimi alıyorum. Eğitimimi yürütürken eğitim grubumdaki örneklerin% 90'ından fazlasını doğru bir şekilde sınıflandırdığım noktaya kadar eğitim kaybının azaldığını görüyorum. Ancak birkaç dönem sonra eğitim kaybının arttığını ve doğruluğumun düştüğünü fark ettim. Eğitim setinde performansın zamanla bozulmamasını beklemesini beklediğim için bu bana garip geliyor. Çapraz entropi kaybı kullanıyorum ve öğrenme hızım 0.0002.

Güncelleme: Öğrenme oranının çok yüksek olduğu ortaya çıktı. Düşük öğrenme hızı ile bu davranışı gözlemlemiyorum. Ancak yine de bu garip buluyorum. Bunun neden olduğuna dair iyi açıklamalar bekliyoruz

Kayıp azalır ve sonra artar

Yanıtlar:


6

Bir CNN eğitimi yaparken benzer bir davranış vardı, çünkü hata hesaplaması için azalan öğrenme oranı ile degrade iniş kullandım. Yineleme sayısını önemli ölçüde artırdınız ve bu davranışın yeni düşük öğrenme oranı ile çok daha sonra gelip gelmediğini kontrol ettiniz mi?


Aslında evet, yeterince yüksek bir öğrenme oranı için bir daha asla yükselmeyeceği bir nokta geliyor. Bunun neden olduğuna dair teorik olarak sağlam bir açıklama arıyorum
dins2018

Hangi optimizasyon algoritmasını kullanıyorsunuz?
Freundlicher

Adam optimiser'ı lr = 0.00001, beta = (0.5, 0.999) ile kullanıyorum
dins2018

1
Sanırım bu küçük öğrenme oranıyla yerel minimum değere o kadar yavaş yaklaşıyorsunuz ki, kayıp değerinin tekrar hafifçe arttığı nokta (minimum değeri aştığınız için) çok fazla yineleme gerektiriyor. Kayıp değerindeki bu artış Adem'e, yerel minimumun aşıldığı ve belirli sayıda yinelemenin yapıldığı andan, küçük bir sayı daha da küçük bir sayıya bölünür ve kayıp değeri patlar.
Freundlicher

2
Beta1 = 0.9 ve beta2 = 0.999'u ayarlayabilirsiniz. Bu davranışa karşı çalışması gereken ortak değerlerdir.
Freundlicher

1

Çünkü öğrenme oranı çok büyük olduğundan, kayıp fonksiyonunun minimumunu saptıracak ve bulamamaktadır. Belirli dönemlerden sonra öğrenme oranını azaltmak için bir zamanlayıcı kullanmak, sorunun çözülmesine yardımcı olacaktır


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.