Yanıtlar:
Verilerdeki gürültü, makul bir miktarda, ağın daha iyi genelleşmesine yardımcı olabilir. Bazen bunun tam tersi bir etkisi vardır. Kısmen gürültünün türüne bağlıdır (yapay yerine "gerçek").
YSA üzerindeki AI SSS iyi bir genel bakış sunar. Alıntı:
Gerçek verilerdeki gürültü hiçbir zaman iyi bir şey değildir, çünkü eğitim seti ne kadar kapsamlı olursa olsun elde edilebilecek genellemenin doğruluğunu sınırlar. Öte yandan, egzersiz sırasında girişlere yapay gürültü (titreşim) enjekte etmek, küçük bir egzersiz setiniz olduğunda pürüzsüz işlevler için genelleştirmeyi iyileştirmenin birkaç yolundan biridir.
Bilgisayar görme gibi bazı alanlarda, bazı örnekleri kopyalayıp bazı sesler veya başka dönüşümler ekleyerek eğitim setinin boyutunu artırmak yaygındır.
Makine öğrenimi modellerini tipik olarak eğitim verilerinin iki farklı bölümünü - temeldeki genelleştirilebilir gerçek (sinyal) ve bu veri kümesine özgü (gürültü) rastgele modelleme olarak düşünüyoruz.
Bu parçaların her ikisinin de takılması eğitim seti doğruluğunu artırır, ancak sinyalin takılması test setinin doğruluğunu da (ve gerçek dünya performansını) arttırırken gürültünün takılması her ikisini de azaltır. Bu yüzden, gürültüye uymayı zorlaştırmak ve sinyale uyma olasılığını arttırmak için düzenlileştirme ve bırakma ve benzer teknikler kullanıyoruz.
Eğitim verilerindeki gürültü miktarını arttırmak böyle bir yaklaşımdır, ancak bu kadar yararlı görünmemektedir. Rastgele titremeyi rakip güçlendirme ile karşılaştırın, örneğin; birincisi yavaş ve dolaylı olarak sağlamlığı artıracak, ikincisi ise onu dramatik ve doğrudan geliştirecektir.
Not: Burada verilen bazı çok iyi cevaplar var, birisinin bunu yararlı bulacağını ümit ederek sadece bu cevapları ekleyeceğim:
Bir veri kümesine gürültü katmak gerçekten de bir model üzerinde olumlu bir etkiye sahip olabilir. Aslında bu, normalde bırakma gibi normalleştiricilerle aynı şeyi yapıyormuş gibi görülebilir . Bunu yapmanın bazı örnekleri Zur at.al , Cires¸at.al'dır, burada yazarlar aşırı uyumu azaltmak için veri kümesine başarıyla gürültü sokmuştur.
Yakalama ne kadar çok gürültü olduğunu bilmek olduğunu. Çok fazla gürültü eklerseniz, sonuç kümesinin artık orijinal veri kümesine yeterli benzerlik içermemesi nedeniyle veri kümenizi işe yaramaz hale getirebilir, bu nedenle tamamen farklı bir veri kümesi üzerinde eğitim alabilirsiniz. Böylece, aşırı yüksek ayrılma oranlarında olduğu gibi, çok fazla gürültünün yetersiz oturmaya neden olduğu görülebilir.
Ne demişler; değişim dengesi hayatın baharattır :).