Önyargı nasıl başlatılmalı ve düzenli hale getirilmelidir?


13

Çekirdek başlatma hakkında birkaç makale okudum ve birçok makale çekirdeğin L2 düzenini kullandıklarını belirtiyor (genellikle ).λ=0.0001

Herhangi biri, önyargıyı sabit sıfır ile başlatmaktan ve normalleştirmekten farklı bir şey yapıyor mu?

Çekirdek başlatma kağıtları

Yanıtlar:


15

Stanford CS231N Notlarından ( http://cs231n.github.io/neural-networks-2/ ):

Önyargıların başlatılması. Asimetri kırılması, ağırlıklardaki küçük rastgele sayılar tarafından sağlandığından, önyargıların sıfır olarak başlatılması mümkündür ve yaygındır. ReLU doğrusal olmama durumları için, bazı insanlar tüm önyargılar için 0.01 gibi küçük sabit bir değer kullanmayı sever, çünkü bu, tüm ReLU birimlerinin başlangıçta ateşlenmesini ve dolayısıyla bir degrade elde etmesini ve yayılmasını sağlar. Bununla birlikte, bunun tutarlı bir iyileşme sağlayıp sağlamadığı açık değildir (aslında bazı sonuçlar bunun daha kötü performans gösterdiğini göstermektedir) ve sadece 0 önyargı başlatmayı kullanmak daha yaygındır.

LSTM'lerde önyargıları 1 olarak başlatmak yaygındır - örneğin http://www.jmlr.org/proceedings/papers/v37/jozefowicz15.pdf adresine bakın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.