Hatalar ve artıklar arasındaki fark nedir?


Yanıtlar:


22

Hatalar gerçek veri oluşturma sürecine (DGP) aitken, artıklar modelinizi tahmin ettikten sonra geriye kalanlardır . Gerçekte, normallik, eşcinsellik ve bağımsızlık gibi varsayımlar, modelinizin kalıntıları için değil, DGP'nin hataları için geçerlidir. (Örneğin,modelinizdeuygun parametrelerinesahip olmak, yalnızca N - ( p + 1 ) artıklar bağımsız olabilir.) Bununla birlikte, yalnızca artıklara erişimimiz var, bu yüzden bununla çalışıyoruz. p+1N(p+1)


9
(+1) Artıklar hataların tahmini olarak kabul edilebilir .
Scortchi - Monica'yı eski durumuna döndürün

@ABC, DGPaçılımı üreten veri işlemi . Modeliniz uygun olsa ve DGP'nin gerçek yapısını yansıtsa bile, altta yatan hatalar olmasaydı artıklar normal, homoscedastik ve bağımsız olmayacaktır.
gung - Reinstate Monica

@Scortchi Merhaba, yorumunuzda genişleyen referanslarınız var mı? Asıl kalıntıların neden hatanın tahminleri olarak kullanılabileceğini anlamaya çalışıyorum, çünkü gerçek varsayım hata normu olduğu zaman regresyon analizinde artıkların normalliğini kontrol eden insanları görüyorum ve bunun neden geçerli olduğunu tam olarak bilmiyorum.
Austin

@Austin, hala bununla ilgileniyorsanız, yeni bir soru sormalısınız.
gung - Monica'yı eski

16

Bir hata , gözlemlenen değer ile gerçek değer arasındaki farktır (DGP tarafından üretilen çoğu zaman gözlemlenmez).

Bir kalıntı gözlenen değer ve (modele göre) tahmin edilen değer arasındaki farktır.


±

Bu bağlantı ( ece.rochester.edu/courses/ECE111/error_uncertainty.pdf ), Bevington ve Taylor'un konuyla ilgili metinlerine atıfta bulunarak iyi bir açıklama sağlar.
Steven C. Howell

Makine öğrenim dilinde artık eğitim hatası ve hata test hatası mıdır?
Charles Chow

@CharlesChow Hangi veri kümesini kullandığınıza bağlıdır. Eğitim seti kullanıyorsanız, o zaman egzersiz hatasıdır; test seti kullanırsanız, test hatasıdır.
Leopold

7

Hata terimi hiçbir zaman gözlemlenemeyen teorik bir kavramdır, ancak artık bir regresyon yapıldığında hesaplanan gerçek bir dünya değeridir.


-1

Veri kümesinin hatası , gözlemlenen değerler ile gerçek / gözlemlenmemiş değerler arasındaki farklardır. Artık , regresyon modeli çalıştırıldıktan sonra hesaplanır ve gözlenen değerler ile tahmini değerler arasındaki farklardır.


1
Bu bir aşağı oy gerektirmez, yanlış değildir. Ben bir downvote var nedeni olduğunu düşünüyorum çünkü cevabınız zaten bu konu üzerinde mevcut olan ve herhangi bir yeni bilgi eklemiyor birkaç cevap aynı. Çoğu zaman böyle olur, eğer cevabınızı bu konuya göndermezsiniz. Burada katkıda bulunabileceğiniz ve cevaplayabileceğiniz başka bir ileti dizisi bulun.
gung - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.