Farklı terminoloji, farklı sözleşmelere işaret eder. "Artık" terimi, tüm açıklayıcı değişkenler hesaba katıldıktan sonra kalan, yani gerçek öngörülen anlamına gelir. "Tahmin hatası", tahminin gerçek tahminlerden ne kadar saptığını, yani gerçek tahminin gerçek olduğunu gösterir.
Kişinin modelleme anlayışı aynı zamanda hangi sözleşmenin daha doğal olduğunu da etkiler. Bir veya daha fazla özellik sütunu , yanıt sütunu ve tahmin sütunu ile bir veri çerçeveniz olduğunu varsayalım .X=x1,x2...yy^
Bir anlayış "gerçek" değer olduğu ve yalnızca dönüştürülmüş bir sürümüdür . Bu kavramda, ve her ikisi de rasgele değişkenlerdir ( türetilmiş olan). Her ne kadar biz aslında ilgilendiğiniz biridir yüzden gözlemleyebilirsiniz biridir için bir proxy olarak kullanılan . "Hata" ne kadar bu "gerçek" değer sapması bu . Bu, hatanın bu sapma yönünü izleyerek, yani olarak tanımlanmasını önerir .yy^Xyy^y^yy^y^yy^ye=y^−y
Bununla birlikte, “ ” yı “gerçek” değer olarak düşünen başka bir anlayış var . Yani y , bazı deterministik süreçlerle bağlıdır ; belirli bir durumu, belirli bir deterministik değere yol açar. Bu değer daha sonra bazı rastgele işlemlerle bozulur. Bu yüzden . Bu anlayışta, , "gerçek" değeridir. Örneğin, g'nin değerini, yerçekiminden kaynaklanan ivmelenmeyi hesaplamaya çalıştığınızı varsayalım. Bir grup nesneyi düşürüyorsunuz, ne kadar düştüklerini ( ) ve düşmeleri ne kadar sürdüğünü ölçtünüz ( ). Daha sonra verileri y = modeliyle analiz edersiniz.y^XXx→f(X)→f(X)+error()y^Xy2xg−−√. Bu denklemin tam olarak çalışmasını sağlayan g değerinin olmadığını tespit edersiniz. Yani sonra bunu model
y^=2xg−−√
y=y^+error .
Yani değişken y alıp bir "gerçek" değer orada olmak için düşünün, bir aslında fiziksel yasalar tarafından oluşturuluyor ve ardından diğer bazı değer olan şey bağımsız modifiye gibi ölçüm hataları veya rüzgar esintileri veya her neyse.y^yy^X
Bu anlayışta, y " alıp gerçekliğin" yapması "gerektiği ve bunu kabul etmeyen cevaplar alırsanız, gerçekte yanlış cevap. Şimdi elbette bu, bu şekilde konulduğunda aptalca ve kibirli görünebilir, ancak bu anlayışı sürdürmek için iyi nedenler vardır ve bu şekilde düşünmek faydalı olabilir. Ve sonuçta, bu sadece bir model; istatistikçiler mutlaka bunun aslında dünyanın işleyişinin böyle olduğunu düşünmüyorlar (muhtemelen bazıları olsa da). Ve denklemi göz önüne alındığında, hataların gerçek eksi öngörüldüğü şeklinde olur.2xg−−√y=y^+error
Ayrıca, ikinci anlayışın "gerçeği yanlış anladı" yönünden hoşlanmıyorsanız, "y'nin bağlı olduğu bazı süreçleri belirledik , ancak almadığımızı" tam olarak doğru cevaplar, bu yüzden y'yi de etkileyen başka bir g süreci olmalı. " Bu varyasyondaX
y^=f(X)
y=y^+g(?)
g=y−y^ .