Degrade yayılımınızı 30 zaman adımıyla sınırlamanın , veri kümenizde mümkün olan her şeyi öğrenmesini engelleyeceği doğrudur . Ancak, veri setinize, bunun modelinizdeki özellikler hakkında önemli şeyler öğrenmesini engelleyip engellemeyeceğine kesinlikle bağlıdır!
Eğitim sırasında gradyanı sınırlamak, modelinizin giriş özelliklerini ve gizli durumu yüksek güvenle asimile edebileceği pencereyi sınırlamak gibidir. Test zamanında modelinizi tüm giriş sırasına uyguladığınızdan, tüm giriş özellikleri hakkındaki bilgileri gizli durumuna dahil edebilecektir. Cümle için son tahminini yapana kadar bu bilgilerin nasıl korunacağını tam olarak bilemeyebilir , ancak yine de yapabileceği bazı (kuşkusuz daha zayıf) bağlantılar olabilir.
Öncelikle tartışmalı bir örnek düşünün. Ağınızın, girişinde herhangi bir yerde 1, aksi takdirde 0 varsa, varsayalım. Ağı 20 uzunluk dizileri üzerinde eğittiğinizi ve daha sonra degradeyi 10 adımla sınırlandırdığınızı varsayalım. Eğitim veri kümesi bir girişin son 10 adımında asla 1 içermiyorsa, ağın herhangi bir yapılandırmanın test girişleriyle ilgili bir sorunu olacaktır. Ancak, eğitim setinde [1 0 0 ... 0 0 0] gibi bazı örnekler ve [0 0 0 ... 1 0 0] gibi diğer örnekler varsa, ağ " girişinin herhangi bir yerinde 1 "özellik.
O zaman duygu analizine dön. Eğitim sırasında modelinizin "bundan nefret ediyorum çünkü ... etrafında ve etrafında" gibi uzun bir negatif cümle ile karşılaşacağını varsayalım, elips şeklinde 50 kelime. Gradyan yayılımını 30 zaman adımıyla sınırlandırarak, model "bundan nefret ediyorum, çünkü" çıkış etiketine bağlamaz, bu nedenle bu eğitimden "I", "nefret" veya "bu" kelimelerini almaz misal. Fakat cümlenin sonundan itibaren 30 zaman aralığında olan kelimeleri alacaktır. Eğitim setinizde aynı kelimeleri içeren, muhtemelen "nefret" ile birlikte başka örnekler de varsa, "nefret" ile negatif duygu etiketi arasındaki bağlantıyı alma şansı vardır. Ayrıca, daha kısa eğitim örnekleriniz varsa, "Korkunç olduğu için bundan nefret ediyoruz!" Deyin. modeliniz "nefret" ve "bu" özellikleri hedef etikete bağlayabilecektir. Bu eğitim örneklerinden yeterince fazlasına sahipseniz, model bağlantıyı etkili bir şekilde öğrenebilmelidir.
Test zamanında, diyelim ki modeli "Bundan nefret ediyorum çünkü ... gecko'da!" Modelin girdisi, bazı şekillerde modelin gizli durumuna geçirilecek olan "Bundan nefret ediyorum" ile başlayacaktır. Bu gizli durum, modelin gelecekteki gizli durumlarını etkilemek için kullanılır, bu yüzden cümlenin bitiminden önce 50 kelime olsa da, bu ilk kelimelerden gelen gizli durum, asla olmasa bile çıktıyı etkileme konusunda teorik bir şansa sahiptir. "Bundan nefret ediyorum" ve cümlenin sonu arasında bu kadar geniş bir mesafe içeren örnekler üzerinde eğitildi.