Bu iki yaygın terim genellikle eşanlamlı olarak kullanılırken, bazen bir ayrım söz konusudur. Gerçekten bir fark var mı, yoksa tam olarak eş anlamlılar mı?
Bu iki yaygın terim genellikle eşanlamlı olarak kullanılırken, bazen bir ayrım söz konusudur. Gerçekten bir fark var mı, yoksa tam olarak eş anlamlılar mı?
Yanıtlar:
Hatalar gerçek veri oluşturma sürecine (DGP) aitken, artıklar modelinizi tahmin ettikten sonra geriye kalanlardır . Gerçekte, normallik, eşcinsellik ve bağımsızlık gibi varsayımlar, modelinizin kalıntıları için değil, DGP'nin hataları için geçerlidir. (Örneğin,modelinizdeuygun parametrelerinesahip olmak, yalnızca N - ( p + 1 ) artıklar bağımsız olabilir.) Bununla birlikte, yalnızca artıklara erişimimiz var, bu yüzden bununla çalışıyoruz.
DGP
açılımı üreten veri işlemi . Modeliniz uygun olsa ve DGP'nin gerçek yapısını yansıtsa bile, altta yatan hatalar olmasaydı artıklar normal, homoscedastik ve bağımsız olmayacaktır.
Bir hata , gözlemlenen değer ile gerçek değer arasındaki farktır (DGP tarafından üretilen çoğu zaman gözlemlenmez).
Bir kalıntı gözlenen değer ve (modele göre) tahmin edilen değer arasındaki farktır.
Hata terimi hiçbir zaman gözlemlenemeyen teorik bir kavramdır, ancak artık bir regresyon yapıldığında hesaplanan gerçek bir dünya değeridir.
Veri kümesinin hatası , gözlemlenen değerler ile gerçek / gözlemlenmemiş değerler arasındaki farklardır. Artık , regresyon modeli çalıştırıldıktan sonra hesaplanır ve gözlenen değerler ile tahmini değerler arasındaki farklardır.