Bunu açıklamanın basit yolu, normalizasyonun gürültüye uymamasına yardımcı olmasıdır, sinyalin şeklini belirlemek açısından pek bir şey yapmaz. Derin bir görkemli fonksiyon işlevi belirleyicisi olarak derin öğrenmeyi düşünüyorsanız, o zaman karmaşık sinyalin şeklini tanımlamak için çok fazla veriye ihtiyaç duyduğunu anlarsınız.
Gürültü yoksa, NN'nin karmaşıklığının arttırılması daha iyi bir yaklaşım getirecektir. NN'nin boyutuna herhangi bir ceza verilmeyecek, daha büyük her durumda daha iyi olurdu. Bir Taylor yaklaşımı göz önünde bulundurulduğunda, polinom olmayan fonksiyonlar için daha fazla terim daima daha iyidir (sayısal hassasiyet konularını göz ardı ederek).
Bu, gürültünün varlığında bozulur, çünkü gürültüye uymaya başlarsınız. Yani, burada yardımına düzene koymayı gelir: o olabilir böylece bizi inşa etmeye izin gürültüye takılmasını azaltmak büyük doğrusal olmayan problemleri sığdırmak için NN.
Aşağıdaki tartışma cevabım için önemli değil, ancak bazı yorumları yanıtlamak ve yukarıdaki cevabın ana yapısını motive etmek için kısmen ekledim. Temelde cevabımın geri kalanı hamburgerli bir yemekle gelen Fransız yangınları gibidir, atlayabilirsiniz.
(Ir) ile ilgili dava: Polinom regresyonu
Polinom regresyonunun oyuncak örneğine bakalım. Aynı zamanda birçok fonksiyon için oldukça iyi bir tahmin edicidir. bölgesinde işlevine bakacağız . Aşağıdaki Taylor serisinden görebileceğiniz gibi, 7. dereceden genişleme zaten oldukça iyi bir uyum, bu nedenle 7+ dereceden oluşan bir polinomun da çok iyi bir uyum olmasını bekleyebiliriz:sin(x)x∈(−3,3)
Daha sonra, 7 gözlem ile küçük, çok gürültülü bir veri setine aşamalı olarak artan polinomları yerleştireceğiz:
Bilinen birçok insan tarafından polinomlar hakkında söylenenleri gözlemleyebiliriz: kararsızlar ve polinomların sırasındaki artışla çılgınca salınım yapmaya başlıyorlar.
Ancak, sorun polinomların kendisi değildir. Sorun gürültü. Gürültülü verilere polinomları yerleştirdiğimizde, uyumun bir kısmı sinyale değil sese duyar. İşte aynı kesin polinomlar aynı veri setine uyuyor ancak gürültü tamamen kaldırıldı. Uyarlar harika!
7 gözlemleri beri sırayla Bu şaşırtıcı olmamalı 6. için görsel olarak mükemmel uyum dikkat benzersiz olarak Sipariş 6 polinomu tanımlamak için ihtiyaç vardır ve bu düzen 6 zaten çok iyi bir yaklaşım yukarıda biz Taylor yaklaşımı arsa gördüğümüz veri aralığımızda.sin(x)
Ayrıca, yüksek dereceli polinomların, 6. sıraya uygun olmadıklarına dikkat edin, çünkü onları tanımlamak için yeterli gözlem yoktur. Öyleyse, 100 gözlemle neler olduğuna bir bakalım. Aşağıdaki grafikte daha büyük bir veri setinin daha yüksek dereceli polinomlara nasıl uymamızı sağladığını ve böylece daha iyi bir uyum sağladığınızı görüyorsunuz!
Harika, ancak sorun şu ki, genellikle gürültülü verilerle ilgileniyoruz. Aynı 100'e yakın çok gürültülü veri gözlemine uyuyorsanız, neler olduğuna bakın. Birinci kareye geri döndük: yüksek dereceli polinomlar korkunç salınım uyarları üretir. Bu nedenle, veri setinin arttırılması, verilerin daha iyi açıklanması için modelin karmaşıklığının arttırılmasında pek yardımcı olmadı. Bu, yine, çünkü karmaşık model sadece sinyalin şekline değil, aynı zamanda gürültünün şekline de daha iyi uyuyor.
Son olarak, bu problemle ilgili bazı düzenli düzenlemeler deneyelim. Aşağıdaki çizelgede, 9 polinom regresyonu için uygulanan düzenlileştirme (farklı cezalarla) gösterilmektedir. Bunu yukarıdaki sipariş (güç) 9 polinomuna uydurma ile karşılaştırın: uygun bir düzenlileştirme seviyesinde, yüksek dereceli polinomları gürültülü verilere sığdırmak mümkündür.
Sadece net olmadığı takdirde: Polinom regresyonunu bu şekilde kullanmayı önermiyorum. Polinomlar yerel uyum için iyidir, bu nedenle parça başına bir polinom iyi bir seçim olabilir. Tüm etki alanını bunlara sığdırmak genellikle kötü bir fikirdir, çünkü gürültülere karşı hassastırlar, çünkü yukarıdaki parcalardan açıkça görülmesi gerekir. Gürültünün sayısal mı yoksa başka bir kaynaktan mı olduğu bu bağlamda önemli değildir. gürültü gürültüdür ve polinomlar tutkuyla tepki gösterecektir.