"Daha iyi" modelinizin bir fonksiyonudur.
Karışıklık nedeninizin bir kısmı, modelinizin sadece yarısını yazmış olmanızdır.
dediğinizde , bu aslında doğru değildir. Gözlenen değerleriniz eşit değil ; bir hata bileşeni var.y=axbyaxb
Örneğin, bahsettiğiniz iki model (hiçbir şekilde tek olası modeller değil) hata hakkında tamamen farklı varsayımlar yapar.
Muhtemelen daha yakın bir şey kastediyorsunuz .E(Y|X=x)=axb
Ama sonra bir varyasyon hakkında ne diyorsunuz , belirli bir uzak beklentisiyle gelen ? Fark eder, önemi var!Yx
Doğrusal olmayan en küçük kareler modeline uyduğunuzda, hataların toplanır olduğunu ve hataların standart sapmasının veriler arasında sabit olduğunu söylüyorsunuz:
yi∼N(axbi,σ2)
Veya eşdeğer olarak
yi=axbi+ei ,var(ei)=σ2
günlükleri alıp doğrusal bir modele sığdırdığınızda, hatanın günlük ölçeğinde toplanır ve veriler arasında (günlük ölçeğinde) sabit olduğunu söylüyorsunuz. Bu, gözlemlerin ölçeğinde, hata teriminin çarpımsal olduğu ve bu nedenle beklenen değerler daha büyük olduğunda hataların daha büyük olduğu anlamına gelir :
yi∼logN(loga+blogxi,σ2)
Veya eşdeğer olarak
η i ∼ logN ( 0 , σ 2 )yi=axbi⋅ηi ,ηi∼logN(0,σ2)
( 1 olmadığını unutmayın. küçükse, bu efekt için izin vermeniz gerekir)σ 2E(η)σ2
(Normallik / lognormal dağılımları varsaymadan en az kareler yapabilirsiniz, ancak tartışılan merkezi sorun hala geçerlidir ... ve normalliğe yakın bir yerde değilseniz, muhtemelen farklı bir hata modeli düşünmelisiniz)
Bu yüzden en iyi olan, hangi tür hata modelinin durumunuzu tanımladığına bağlıdır.
Eğer daha önce görülmemiş sürülmemiştir verilerin çeşit bazı keşif analiz yapıyorsanız [, aşağıdaki gibi soruları dikkate alacağını "veri neye önem verirsiniz? (Yani karşı çizilen ? Artıklar karşı gibi neye ? Öte yandan, bu gibi değişkenler nadir değilse, genel davranışları hakkında zaten bilgi sahibi olmalısınız.]x xyxx