Ayrılmayı ve diğer düzenlemeleri inceleyen çalışmalar var mı?


9

Tercihen farklı alanlarda (veya en azından farklı veri kümelerinde) nöral ağlar için düzenleme yöntemlerinin farklılıklarını gösteren yayınlanmış makaleler var mı?

Soruyorum çünkü şu anda çoğu insanın bilgisayar görüşünde düzenlileştirme için sadece bırakma hissi verdiğini hissediyorum. Farklı düzenleme yöntemleri kullanmak için bir neden olup olmadığını kontrol etmek istiyorum.

Yanıtlar:


3

İki puan:

  1. Bırakma genellikle sinir ağları topluluklarıyla da karşılaştırılır. Eğitimin ve birkaç sinir ağının ortalamasının performans faydalarından bazılarına sahip olduğu görülmektedir.
  2. Bırakma kalibrasyonu normalleştirmekten daha kolaydır. Bırakma oranı olan tek bir hiperparametre vardır ve insanlar antrenman yaparken 0.5'i (ve daha sonra elbette değerlendirmede :)) kullanırlar, örneğin bu TensorFlow örneğine bakın .

Her neyse, sinir ağlarının ampirik çalışmalarına biraz şüpheliyim. Ağın topolojisinden gradyan iniş optimizasyon prosedürüne ve aktivasyon fonksiyonlarına ve her neyse, normalleştirme gibi test ettiğinize kadar ince ayar yapmak için çok fazla hiperparametre vardır. Daha sonra, her şey stokastiktir ve genellikle performans kazançları o kadar küçüktür ki, farklılıklar için istatistiksel olarak test edemezsiniz. Birçok yazar istatistiksel test yapmaktan bile rahatsız değil. Sadece çapraz doğrulamayı ortalama yaparlar ve hangi modelin kazanan olmak için en yüksek ondalık puan kazancına sahip olduğunu beyan ederler.

Bırakmayı teşvik eden bir çalışmayı, yalnızca başka bir düzenleyici teşvik ile çelişmek üzere bulabilirsiniz.

Bence her şey estetik tercihlerine bağlı. Bırakma IMHO, normalleşmeden daha biyolojik olarak akla yakın geliyor. Kalibre edilmesi de daha kolay görünüyor. Bu yüzden, kişisel olarak TensorFlow gibi bir çerçeve kullanırken tercih ederim. Sık sık yaptığımız kendi sinir ağımızı kullanmamız gerekiyorsa, uygulamayı kolaylaştıracağı için düzenlileştirmeyi kullanacağız.


0

Kesinlikle. Yaratan'ın makalesi Geoffrey Hinton. https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf okuyun. Ama ben onu uygulayarak farkı görmeye teşvik ediyorum.


2
Makale, o sırada son teknoloji sonuçlarda iyileşme olarak iyileşme göstermesi dışında, farklı düzenleyici yaklaşımlar arasında açık bir şekilde karşılaştırma yapmamaktadır (önceki sonuçlar büyük olasılıkla diğer bazı düzenleme biçimlerini kullanmıştır, ancak bunlar listelenmemiştir). Ayrıca, maksimum bırakma için etkili bir ek düzenleyici olarak maksimum ağırlık kısıtlamalarından bahseder.
Neil Slater
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.