Düzenleme, sonlu egzersiz verisi örneklerinden öğrenmeye çalıştığımız neredeyse tüm makine öğrenimi algoritmalarında kullanılır.
Düzenleme kavramının doğuşunu açıklayarak özel sorularınıza dolaylı olarak cevap vermeye çalışacağım. Tam teori çok daha ayrıntılıdır ve bu açıklama tam olarak yorumlanmamalıdır, ancak daha fazla keşif için sizi doğru yönde göstermeyi amaçlamaktadır. Birincil amacınız sezgisel bir düzenlenme anlayışı elde etmek olduğundan , Simon Haykin'in 3. baskısı olan "Yapay Sinir Ağları ve Öğrenme Makineleri" Bölüm 7'den (ve bunu yaparken birkaç ayrıntıyı) aşağıdaki açıklamayı özetledim ve büyük ölçüde basitleştirdim.
xiyif
Bunu daha da ileri götürmek için, Hadamard'ın "iyi pozlanmış" bir sorun terminolojisini anlayalım - bir sorun, aşağıdaki üç koşulu karşılarsa iyi bir şekilde ortaya konulur:
- xiyi
- x1x2f(x1)=f(x2)x1=x2
- f
Denetimli öğrenme için bu koşullar ihlal edilebilir, çünkü:
- Belirli bir giriş için ayrı bir çıktı olmayabilir.
- Eğitim örneklerinde benzersiz bir giriş-çıkış eşlemesi oluşturmak için yeterli bilgi olmayabilir (çünkü farklı algoritma örnekleri üzerinde öğrenme algoritmasını çalıştırmak farklı eşleme işlevleriyle sonuçlanır).
- Verilerdeki gürültü, rekonstrüksiyon sürecine kararlılığını etkileyebilecek belirsizlik ekler.
Tikhonov, bu tür "kötü durumdaki" sorunları çözmek için, çözüm hakkında önceden bilgi içeren negatif olmayan bir işlev ekleyerek çözümü stabilize etmek için bir düzenleme yöntemi önerdi.
Önceki bilgilerin en yaygın biçimi, girdi-çıktı eşleme işlevinin düzgün olduğu varsayımını içerir - yani benzer girdiler benzer çıktılar üretir.
λfλ∞∞
λ
Bu tür düzenli maliyet fonksiyonlarına bazı örnekler:
Doğrusal Regresyon:
J(θ)=1m∑mi=1[hθ(xi)−yi]2+λ2m∑nj=1θ2j
Lojistik regresyon:
J(θ)=1m∑mi=1[−yilog(hθ(xi))−(1−yi)log(1−hθ(xi))]+λ2m∑nj=1θ2j
θxhθ(x)y
L2
Düzenlemenin uygulanmasının net etkisi, aşırı uyumu azaltan model karmaşıklığını azaltmaktır. Düzenlemeye yönelik diğer yaklaşımlar (yukarıdaki örneklerde listelenmemiştir), daha basit ağaçlar yapmak için düğümleri bırakarak, regresyon / sınıflandırma Ağaçlar, güçlendirilmiş ağaçlar, vb. Daha yakın zamanda bu, sinir ağındaki nöronlar arasındaki bağlantıların kesilmesiyle "derin öğrenme" denilen bir uygulama olmuştur.
Üçüncü çeyreğe verilen özel bir cevap, Rastgele Orman (veya benzer oylama şemaları) gibi bazı toplanma yöntemlerinin, doğası gereği yöntemlerinden dolayı düzenlileştirme elde etmesidir, yani yanıtı düzenlenmemiş Ağaçlar koleksiyonundan oylama ve seçme. Her ne kadar tek tek ağaçlarda fazlalık olsa da, sonuçlarının "ortalamasını alma" süreci, topluluğun eğitim setine fazla sığmasını engeller.
DÜZENLE:
Düzenlilik kavramı aksiyomatik küme teorisine aittir, işaretçiler için bu makaleye başvurabilirsiniz - en.wikipedia.org/wiki/Axiom_of_regularity ve ayrıntılarla ilgileniyorsanız bu konuyu daha fazla inceleyebilirsiniz.
Sinir ağları için regülasyonda: Geri yayılma algoritmasını çalıştırırken ağırlıkları ayarlarken, regülasyon terimi maliyet fonksiyonuna doğrusal ve lojistik regresyon örnekleriyle aynı şekilde eklenir. Dolayısıyla, düzenleyici terimin eklenmesi, geri yayılmanın küresel minimaya ulaşmasını engeller.
Sinir ağları için toplu normalleştirmeyi açıklayan makale - Toplu Normalleştirme: Dahili Eş Değişimi Azaltarak Derin Ağ Eğitimini Hızlandırma, Ioffe, Szegedy, 2015. Giriş değişkenleri normalleştirildiğinde sinir ağını eğitmek için geri çoğaltmanın daha iyi çalıştığı bilinmektedir. Bu yazıda yazarlar, bir nöral ağın birçok katmanını eğitirken "gradyanları yok etme" probleminden kaçınmak için Stokastik Degrade İnişte kullanılan her bir mini partiye normalizasyon uyguladılar. Kağıtlarında açıklanan algoritma, her bir aktivasyon katmanı için her bir parti içinde hesaplanan ortalama ve varyansı, mini-grup SGD'de optimize edilmiş başka bir parametre seti olarak (NN ağırlıklarına ek olarak) ele alır. Daha sonra aktivasyonlar tüm eğitim seti kullanılarak normalleştirilir. Bu algoritmanın tüm ayrıntıları için makalelerine başvurabilirsiniz. Bu yöntemi kullanarak, normalleştirme için kesintileri kullanmaktan kaçınabildiler ve bu nedenle bunun başka bir düzenlenme türü olduğu iddiası.