Küçük veri kümesinde LSTM'nin aşırı takılmasını önleme


13

80 boyutlu bir word2vec benzeri temsil kullanarak 128 gizli birimleri ile tek bir katman LSTM kullanarak duygu tahmini için 15000 tweet modelleme. 1 çağdan sonra bir iniş doğruluğu (rastgele% 38 =% 20) alıyorum. Daha fazla eğitim, eğitim doğruluğu tırmanmaya başladığında doğrulama doğruluğunun azalmaya başlamasını sağlar - açık bir aşırı sığdırma işareti.

Dolayısıyla düzenli hale getirmenin yollarını düşünüyorum. Gizli birimlerin sayısını azaltmamayı tercih ederim (128 şimdiden biraz düşük görünüyor). Şu anda% 50 olasılıkla bırakma kullanıyorum, ancak bu belki artabilir. Optimize edici, Keras için varsayılan parametreleri olan Adam'dır ( http://keras.io/optimizers/#adam ).

Veri setimdeki bu model için fazla sığdırmayı azaltmanın etkili yolları nelerdir?


Aynı problemi yaşıyorum. Sonunda LSTM'nizi düzenli hale getirmeyi nasıl başardınız? LSTM'nin doğrulama doğruluğu% 41'dir. Giriş şeklim (200,) ve 64 birim ile 1 LSTM katmanım var, onu 0.4 bırakma ile 2 Yoğun katman takip ediyor.
Nirvan Anjirbag

Yanıtlar:


8

Deneyebilirsiniz:

  • Gizli birimlerin sayısını azaltın, zaten düşük göründüğünü söylediğinizi biliyorum, ancak giriş katmanının sadece 80 özelliği olduğu göz önüne alındığında, aslında 128 çok fazla olabilir. Temel kural, gizli birimlerin sayısının, girdi birimi (80) ve çıktı sınıfı (5) sayısı arasında olması;
  • Alternatif olarak, giriş gösterim alanının boyutunu 80'den fazla olacak şekilde artırabilirsiniz (ancak, gösterim herhangi bir kelime için zaten çok darsa, bu durumdan fazla olabilir).

Bir ağa uymanın iyi bir yolu, fazla takılan bir ağla başlamaktır ve daha sonra artık sığmayacak kadar kapasiteyi (gizli birimler ve gömme alanı) azaltmaktır.


1
L1 ve l2 düzenini denediniz mi? Gerçekten işe yarıyor mu? Bu cevap genel olarak bunu yapmamanız gerektiğini gösteriyor
Jakub Bartczuk

RNN'lerin bu özelliğinin farkında değildim, cevabın bu noktasını sileceğim
Miguel

Merhaba, "gizli birimlerin sayısının giriş birimlerinin ve çıkış sınıflarının arasında olmasını" belirten temel kuralın nasıl olduğunu merak ediyordum. Önerebileceğim bir kağıt var mı?
Kong

Başparmak kuralları hakkında bir şey var, nereden bulduğumu bilmiyorum ...
Miguel
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.