Occam'ın tıraş bıçağı prensibi:
Aynı ampirik riski (burada, eğitim hatası) olan iki hipoteze (burada, karar sınırları) sahip olmak, kısa bir açıklama (burada, daha az parametreye sahip bir sınır), uzun bir açıklamadan daha geçerli olma eğilimindedir.
Örneğin, hem A hem de B'nin sıfır eğitim hatası vardır, bu nedenle B (daha kısa açıklama) tercih edilir.
Egzersiz hatası aynı değilse ne olur?
A sınırında B'den daha küçük bir eğitim hatası varsa, seçim zorlaşır. "Açıklama boyutu" nu "ampirik risk" ile aynı olarak ölçmeli ve ikisini bir puanlama fonksiyonunda birleştirmeliyiz, sonra A ve B'yi karşılaştırmaya devam etmeliyiz . Bir örnek , ampirik riski (negatif ile ölçülen) birleştiren Akaike Bilgi Ölçütü (AIC) olacaktır. log olabilirliği) ve açıklama boyutu (parametre sayısı ile ölçülür) bir puan olarak.
Bir yan not olarak, AIC tüm modeller için kullanılamaz, AIC'ye de birçok alternatif vardır.
Doğrulama kümesiyle ilişki
Birçok pratik durumda, model daha düşük bir eğitim hatasına ulaşmak için daha fazla karmaşıklığa (daha büyük açıklama) doğru ilerlediğinde, AIC ve benzerleri bir doğrulama setiyle (modelin eğitilmediği bir set) değiştirilebilir. Doğrulama hatası (doğrulama setindeki model hatası) artmaya başladığında ilerlemeyi durdururuz. Bu şekilde, düşük eğitim hatası ile kısa açıklama arasında bir denge kurarız.