Yanıtlar:
Aslında hayır.
Buradaki soru biraz geneldir ve gerçekten ilişkili olmayan iki şeyi karıştırır. Aşırı takma genellikle genelleştirilmiş bir tanım olmanın karşıt kalitesi olarak ifade edilir; aşırı donanımlı (veya aşırı eğitimli) bir ağın daha az genelleme gücüne sahip olacağı anlamındadır. Bu kalite öncelikle ağ mimarisi, eğitim ve doğrulama prosedürü tarafından belirlenir. Veriler ve özellikleri yalnızca "eğitim prosedürünün gerçekleştiği bir şey" olarak girilir. Bu az çok "ders kitabı bilgisi" dir; James, Witten, Hastie ve Tibshirani'nin "İstatistiksel Öğrenmeye Giriş" i deneyebilirsiniz. Ya da Bishop tarafından "Örüntü Tanıma" (genel konu hakkında şimdiye kadarki en sevdiğim kitap). Veya Bishop tarafından da "Örüntü Tanıma ve Makine Öğrenmesi".
Korelasyonun kendisi için: Belirli bir boyuta sahip girdi alanını düşünün. Hangi dönüşümü kullanırsanız kullanın, boyutluluk aynı kalacaktır - lineer cebir bunu söyler. Bir durumda, verilen taban tamamen ilişkisiz olacaktır - değişkenlerin korelasyonunu kaldırdığınızda veya PAT (Prensip Eksen Dönüşümü) uyguladığınızda elde ettiğiniz şey budur. Bunun için herhangi bir doğrusal cebir kitabını alın.
Uygun bir mimariye sahip bir nöral ağ herhangi bir (!) Fonksiyonunu modelleyebileceğinden, önce PAT'yi modelleyebileceğini ve sonra da yapılması gereken her şeyi yapabileceğini varsayabilirsiniz - örneğin sınıflandırma, regresyon, vb.
Ayrıca korelasyonu, verilerin bir özelliği olduğu için sinir ağı açıklamasının bir parçası olması gereken bir özellik olarak da düşünebilirsiniz. Verilerin bir parçası olmaması gereken bir şey olmadığı sürece korelasyonun doğası gerçekten önemli değildir. Bu aslında farklı bir konu olacaktır - girişteki gürültü gibi bir şeyi modellemeli veya ölçmelisiniz ve hesaba katmalısınız.
Yani, özet no. İlişkili veriler, verilerin teknik olarak daha basit ve daha verimli kullanılmasını sağlamak için daha fazla çalışmanız gerektiği anlamına gelir. Aşırı sığdırma meydana gelebilir, ancak ilişkili veriler olduğu için gerçekleşmez.
melek yüz ifadesi aşırı uydurma ile ilgili ifadesinde doğrudur. Bununla birlikte, yüksek derecede korelasyonlu özelliklerin ve YSA'nın tartışılmasını çok fazla kolaylaştırıyor.
Evet, teorik olarak bir YSA'nın herhangi bir işleve yaklaşabileceği doğrudur. Bununla birlikte, pratikte çok sayıda yüksek derecede ilişkili özellik eklemek iyi bir fikir değildir. Bunu yapmak, modelin içinde birçok fazlalık getirecektir. Bu tür fazlalıkların dahil edilmesi gereksiz karmaşıklıklara yol açacaktır ve bunu yapmak yerel minima sayısını artırabilir. Bir YSA'nın kayıp fonksiyonunun doğası gereği düzgün olmadığı göz önüne alındığında, gereksiz pürüzlülük getirmek harika bir fikir değildir.