Bu konuda hala hızlanmaya çalıştığım için şimdiden özür dilerim. Benim nöron aktivasyon fonksiyonu için tanh (harita -1 1) vs sigmoid (harita 0 1) kullanarak artılarını ve eksilerini anlamaya çalışıyorum. Okuduğumdan beri, marjinal farklılıklarla küçük bir şey gibi geldi. Sorunlarım için pratikte sigmoidin eğitilmesinin daha kolay olduğunu ve garip bir şekilde sigmoid'in genel çözümü daha iyi bulduğunu düşünüyorum. Bununla demek istediğim, sigmoid versiyon eğitimi tamamlandığında, tanh versiyonunun referans üzerinde zayıf bir şekilde yaparken eğitim verileri hakkında doğru cevapları alabildiği referans (eğitimsiz) veri setinde iyi iş çıkarıyor. Bu aynı ağ mimarisi içindir.
Bir sezgi, sigmoid ile, bir nöronun neredeyse tamamen kapanmasının daha kolay olması, böylece sonraki katmanlara hiçbir girdi sağlamamasıdır. Tanh'ın girişlerini mükemmel bir şekilde iptal etmesi gerektiğinden burada daha zor bir zamanı var, aksi takdirde her zaman bir sonraki katmana bir değer veriyor. Belki de bu sezgi yanlıştır.
Uzun yazı. Sonuç olarak, ticaret nedir ve büyük bir fark yaratmalı mı?