Fazla giydirmeye dikkat et . Bir sistemden toplanan verilerin daha doğru bir modeli, sistemin gelecekteki davranışının daha iyi bir göstergesi olmayabilir.
Yukarıdaki resimde, bazı verilerin iki modeli gösterilmektedir.
Doğrusal çizgi, antrenman verileri üzerinde bir miktar doğrudur (grafikteki noktalar) ve (beklenir), test verilerinde (noktaların x <5 ve x> -5 olması muhtemel olduğu yerlerde) biraz doğru olacaktır. ).
Buna karşılık, polinom eğitim verileri için% 100 doğrudur, ancak (9. derece polinomun bazı fiziksel nedenlerden dolayı makul olduğuna inanmak için herhangi bir nedeniniz yoksa), bunun x> 5 ve x <-5.
Doğrusal model, topladığımız verilerle herhangi bir hata karşılaştırmasına dayanarak, 'daha az doğrudur'. Ancak daha genelleştirilebilir.
Ek olarak, Mühendisler modelleriyle ilgili daha az endişe etmek ve insanların modelle ne yapacakları hakkında daha fazla endişelenmek zorundadır.
Size sıcak bir günde yürüyüşe çıkacağımızı ve 426 dakika sürmesi gerektiğini söylersem. Size yürüyüşün 7 saat süreceğini söylesem daha az, hatta yürüyüşün 4-8 saat süreceğini söylediğimden daha az su getirme ihtimaliniz yüksek. Bunun nedeni, öngörülen zamanımın orta noktası yerine, öngördüğümdeki ima edilen güven düzeyime cevap vermenizdir.
İnsanlara doğru bir model verirseniz, insanlar hata paylarını azaltır. Bu daha büyük risklere yol açar.
Sıcak bir günde yürüyüşe çıkacağım bir örnekte, yürüyüşün vakaların% 95'inde 4-8 saat süreceğini, navigasyon ve yürüme hızında bazı belirsizliklerin yaşandığını biliyorum. Mükemmel yürüme hızımızın 4-8 rakamının belirsizliğini azaltacağını bilmemiz, ancak bu, 'suyun sorun yaratması için o kadar uzun sürmemiz olasılığını' önemli ölçüde etkilemeyecektir, çünkü bu neredeyse tamamen belirsiz navigasyon tarafından yönlendirilir, belirsiz yürüme hızı.