Echo State Network, Reservoir Computing'in daha genel konseptinin bir örneğidir . ESN'nin arkasındaki temel fikir, bir RNN'den (birbirine bağlı bir dizi girdi, yani bir sinyal gibi zaman bağımlılıkları) fayda sağlamak, ancak yok olan gradyan problemi gibi geleneksel bir RNN eğitimi problemleri olmadan elde etmektir .
ESN'ler bunu, sigmoidal bir transfer fonksiyonu (giriş boyutuna göre, 100-1000 birim gibi bir şey) kullanarak nispeten büyük bir bağlı nöron rezervuarına sahip olarak elde eder. Rezervuardaki bağlantılar bir kez atanır ve tamamen rastgeledir; rezervuar ağırlıkları eğitilmez. Giriş nöronları rezervuara bağlanır ve giriş aktivasyonlarını rezervuara besler - bunlara da eğitimsiz rastgele ağırlıklar atanır. Eğitilen tek ağırlıklar, rezervuarı çıkış nöronlarına bağlayan çıkış ağırlıklarıdır.
Eğitimde, girdiler rezervuara beslenecek ve çıktı birimlerine öğretmen çıktısı uygulanacaktır. Rezervuar durumları zamanla yakalanır ve saklanır. Tüm eğitim girdileri uygulandıktan sonra, yakalanan rezervuar durumları ve hedef çıktılar arasında basit bir doğrusal regresyon uygulaması kullanılabilir. Bu çıkış ağırlıkları daha sonra mevcut ağa dahil edilebilir ve yeni girdiler için kullanılabilir.
Fikir şu ki, rezervuardaki seyrek rastgele bağlantılar, önceki durumların geçtikten sonra bile "yankıya" izin vermesidir, böylece ağ eğitildiği bir şeye benzer yeni bir girdi alırsa, rezervuardaki dinamikler giriş için uygun aktivasyon yörüngesini takip edin ve bu şekilde eğitildiği şeyle eşleşen bir sinyal sağlayabilir ve eğer iyi eğitimli ise, daha önce gördüklerinden genelleştirebilir, mantıklı olacak aktivasyon yörüngelerini takip edebilir. rezervuarı tahrik eden giriş sinyali verildi.
Bu yaklaşımın avantajı inanılmaz derecede basit bir eğitim prosedürüdür çünkü ağırlıkların çoğu sadece bir kez ve rastgele atanır. Yine de zaman içinde karmaşık dinamikleri yakalayabilirler ve dinamik sistemlerin özelliklerini modelleyebilirler. ESN'lerde bulduğum en yararlı makaleler:
Her ikisinin de biçimcilikle birlikte gidecek açıklamaları kolay ve uygun parametre değerlerini seçmek için rehberli bir uygulama oluşturmak için olağanüstü tavsiyeler var.
GÜNCELLEME: Derin Öğrenme kitabı Goodfellow, Bengio ve Courville gelen Yankı Devlet Ağların biraz daha ayrıntılı ama yine de güzel üst düzey tartışma vardır. Bölüm 10.7'de yok olan (ve patlayan) gradyan problemi ve uzun süreli bağımlılıkları öğrenmenin zorlukları tartışılmaktadır. Bölüm 10.8 tamamen Yankı Devlet Ağları ile ilgilidir. Spesifik olarak, uygun spektral yarıçap değerine sahip rezervuar ağırlıklarının seçilmesinin neden önemli olduğu hakkında ayrıntılara girer - bilgiyi zaman içinde yayırken istikrarı teşvik etmek için doğrusal olmayan aktivasyon birimleriyle birlikte çalışır.