Kasra Manshaei iyi bir genel cevap verirken (+1), anlaşılması kolay bir örnek vermek istiyorum.
Çok basit bir problem düşünün: İşlev takma f:[0,1]→R. Bunu yapmak için, polinom sınıfından bir model alırsınız. Tartışma uğruna, diyelim ki 0 derecelik bir polinom aldınız. Bu modellerin kapasitesi sadece sabitlere sığabileceğinden çok sınırlıdır. Temel olarak ortalama değeri tahmin edecektir (elbette hata fonksiyonuna bağlıdır, ancak basit tutun). Yani nispeten hızlı, bu tür bir model için en iyi parametrelerin ne olduğunu oldukça iyi bir tahmin edeceksiniz. Kaç örnek ekleseniz de test ve egzersiz hatanız hemen hemen aynı olacaktır. Sorun yeterli veriye sahip olmadığını değil, sorun modeli yeterince güçlü olmadığı şudur: underfit .
Öyleyse tersini yapalım: 1000 veri noktanız olduğunu varsayalım. Biraz matematik bilmek, 999 derece bir polinom seçersiniz. Şimdi eğitim verilerine mükemmel bir şekilde sığabilirsiniz. Ancak, verileriniz verilere çok iyi uyuyor olabilir. Örneğin, bkz. ( Blogumdan )
Bu durumda, verilere mükemmel şekilde uyan başka modelleriniz de vardır. Açıkçası, mavi model veri noktaları arasında biraz doğal görünmüyor. Modelin kendisi, dağıtım türünü iyi yakalayamayabilir, bu nedenle modeli daha basit bir şeyle sınırlamak aslında yardımcı olabilir. Bu, aşırı takmanın bir örneği olabilir .