@ Ryan-zotti ile hemfikir olmanın, gereğinden fazla zorlanmaya yol açmayacağının - ya da en azından fazla zorlama olarak adlandırmamız için bir miktar olmayacağına katılıyorum. Bu konudaki bakış açımı belirtmeye çalışmama izin verin:
Box bir keresinde şöyle dedi:
Tüm modellerin yanlış olduğunu unutmayın; pratik soru, ne kadar yanlış olmaları gerektiği konusunda faydalı olmamaları gerektiğidir.
(Mükemmel olmak, ilk önce bir model için olan ihtiyacı ortadan kaldıracak olan tüm verileri gerektirecektir).
Modellerin yanlış olması da aşırı ve önemsiz1. Ama bunu mutlaka umursamayız hatta farketmeyiz. Her iki çünkü - soru: a) tüm ve b ölçüsü) onu gereğinden fazla veya yetersiz uyum demiyorlar kabul bulabilirsiniz gerçeklik sapan modelin hangi miktarı hep biz hiç inşa edecek tüm modele biraz uygulayın. Sonunda bizim modellerimiz şartlarımıza ama tatmin ederse örneğin aşırı / underfit sadece asgari veya bizim uygulama durumunda kabul edilmez (mümkünse) veri parçaları üzerinde aşırı / underfit biz bunu kabul edeceklerdir - bu engelleme hakkında mutlaka değil tüm over - / yetersiz uyum.
Bu, sahip olmak istediğimiz şeyin olup olmadığına karar vermek için model hatasını ölçmek / tespit etmek için uygun bir kurulumla sonuçlanır. Bu yüzden yapabileceğimiz şey, en az gürültü ve temsili + yeterli örneklerle veri almaya çalışarak, mümkün olan en iyi şekilde modellemek, değerlendirmek ve seçmek ve tüm bunları makul bir şekilde yapmak gibi işlemleri mümkün olduğunca sağlam kılmaktır. örnekler, birçok özellik→daha az karmaşık model; henüz kabul edilebilir performansa sahip en az karmaşık modeli seçin.
Çünkü: Sonunda her zaman model hatası olur / üst / alt donatı - önemli olan makul seçimleri yapmak, bu hatayı ilgi odağımızda tespit etme / ölçme özelliğidir .
1a) Her model aynı anda yanlılık ve sapma sorununa sahipse (genellikle ihtiyaçlarımızı karşılamak için doğru dengeyi bulmaya çalışırız). Gereksinimlerimizi karşılayan modellerde mutlaka yanlılık ve sapma olacaktır. b) Gürültülü verileri ve temsili olmayan örnekleri, aşırı yüklenme nedenleri olarak düşünün. Her model zorunlu olarak gürültüyü ve aynı zamanda bilginin hangi kısımlarının eksik olduğunu, dolayısıyla hangi yanlış varsayımların yapılacağını gösteren bir ilişkiyi modelleyecektir.