Yapay sinir ağlarında düzenleyici yöntem seçme


9

Sinir ağlarını eğitirken, ağı düzenli hale getirmenin en az 4 yolu vardır:

  • L1 Düzenleme
  • L2 Düzenleme
  • Bırakmak
  • Toplu Normalleştirme

    artı tabii ki ağırlık paylaşımı ve bağlantı sayısının azaltılması gibi, en katı anlamda düzenleyici olmayabilecek diğer şeyler.

    Peki bu düzenleme yöntemlerinden hangisinin kullanılacağını nasıl seçeriz? "Her şeyi deneyin ve neyin işe yaradığını görün" den daha ilkeli bir yol var mı?


  • 3
    Sinir ağlarının prensipleri var mı? Kara kutu yöntemleri için prensip her şeyi denemek ve neyin işe yaradığını görmek
    Darrin Thomas

    Ve bu oldukça üzücü, değil mi?
    Alex

    Yanıtlar:


    6

    Sinir ağlarındaki düzenlenme türleri arasında karar vermenize yardımcı olacak güçlü, iyi belgelenmiş ilkeler yoktur. Düzenleme tekniklerini bile birleştirebilirsiniz, sadece bir tane seçmek zorunda değilsiniz.

    Uygulanabilir bir yaklaşım, deneyime ve farklı sorun alanlarında neyin iyi sonuçlar verdiğini görmek için literatür ve diğer insanların sonuçlarını takip etmeye dayanabilir. Bunu akılda tutarak, bırakma, çok çeşitli sorunlar için çok başarılı oldu ve muhtemelen ne denediğinizden bağımsız olarak iyi bir ilk seçenek olarak düşünebilirsiniz.

    Ayrıca bazen sadece bildiğiniz bir seçeneği seçmek yardımcı olabilir - anladığınız ve deneyimlediğiniz tekniklerle çalışmak, bir parametre için hangi büyüklük sırasını denemek istediğinizden emin olmadığınız farklı seçeneklerden oluşan bir kepçe torbasını denemekten daha iyi sonuçlar elde edebilir. . Önemli bir sorun, tekniklerin diğer ağ parametreleriyle etkileşime girebilmesidir - örneğin, bırakma yüzdesine bağlı olarak bırakma ile katmanların boyutunu artırmak isteyebilirsiniz.

    Son olarak, hangi regülasyon tekniklerini kullandığınız önemli değildir, sadece probleminizi anlarsınız ve aşırı uyduğunda ve daha düzenli hale getirmede ne zaman yapabileceğinizi yeterince iyi modellersiniz. Ya da tam tersi, uygun olmadığında ve düzenlileştirmeyi ölçeklendirmeniz gerektiğinde tespit edin.


    3

    Düzenleme yöntemi

    Aşağıdaki 4 teknik için, L1 Düzenlemesi ve L2 Düzenlemesi, bir düzenleme yöntemi olması gerektiğini söylemek gereksizdir. Ağırlığı daraltırlar. L1, ağırlıklar daha yüksek önem taşıyorsa, daha az miktarda ağırlık çekmeye odaklanacaktır.

    Bırakma, nöronları geçici olarak bırakarak aşırı sığmayı önler. Sonunda, tüm ağırlıkları ortalama olarak hesaplar, böylece ağırlık belirli bir nöron için çok büyük olmaz ve bu nedenle bir düzenlileştirme yöntemidir.

    Parti Normalizasyonu bir düzenlileştirme yöntemi olmamalıdır, çünkü asıl amacı bir parti seçerek ve ağırlığı 0'a yakın, çok büyük değil, çok küçük değil, dağıtılacak şekilde zorlayarak eğitimi hızlandırmaktır.

    Seçmek

    Benim için mini seri şart çünkü süreci hızlandırabilir ve her seferinde ağın performansını artırabilir.

    L1 ve L2'nin her ikisi de benzerdir ve küçük ağda L1'i tercih ederim.

    İdeal olarak, büyük bir varyasyon problemi veya aşırı uyum varsa, bırakma uygulanmalıdır.

    Son olarak, Neil Slater ile durumun duruma bağlı olduğu ve asla optimum bir çözüm olmayacağına katılıyorum.

    Daha fazla bilgi için bunu okumanızı tavsiye ederim. Bu çok iyi bir malzemedir. http://neuralnetworksanddeeplearning.com/chap3.html


    -1

    Bu algoritmik seçimlere ek hiperparametreler olarak bakın ve diğer hiperparametreler için yaptığınız gibi optimize edin. Genellikle bu daha fazla veri gerektirir.


    2
    Merhaba Alex, DS.SE'ye hoş geldiniz. Bu, oylama yoluyla zirveye yüzen en zengin cevaplara sahip bir Soru-Cevap sitesidir. Birisi size oy verdi, belki de cevabınız oldukça kısa ve genellikle çözümü açıklayan (örn.) Orijinal poster tarafından kullanılmayan bir terim olan hiperparametrelerin detaylarını açıklamıyor.
    Marcus D
    Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
    Licensed under cc by-sa 3.0 with attribution required.