Hatalı veriler için en uygun doğrusal regresyon modeli


9

Bağımsız değişken (x) sabit bir ölçüm hatası ve bağımlı değişken (y) sinyale bağlı hatası olan bir veri için en uygun doğrusal regresyon algoritması arıyorum.

resim açıklamasını buraya girin

Yukarıdaki görüntü sorumu açıklıyor.


1
X sabit değişkeni sabit bir ölçüm hatasına sahipse ve hatalar sadece değişkenleri göreceli olarak ağırlıklandırmak için kullanılıyorsa, bu durum x hatalarının olmamasına eşdeğer değil mi?
pedrofigueira

2
@pedro Durum böyle değil, çünkü xsadece bir formülde ağırlık değildir. Değişkenlerde hata regresyonu ile uyumlar farklılık gösterecek ve parametrelerin kovaryans tahminleri normal regresyondan farklı olacaktır.
whuber

1
Açıklama için teşekkürler. Neden böyle olduğunu biraz genişletebilir misiniz?
pedrofigueira

Yanıtlar:


2

Bağımlı değişkente ölçüm hatası

Genel bir doğrusal model verildi

(1)y=β0+β1x1++βkxk+ε
ile ε bağımsız değişkenlerle otokore edilmemiş ve ilişkisiz homosckedastik, y* "doğru" değişkeni belirtmek ve ygözlemlenebilir ölçüsüdür. Ölçüm hatası farkları olarak tanımlanır
e=y-y*
Dolayısıyla, tahmin edilebilir model:
(2)y=β0+β1x1++βkxk+e+ε
Dan beri y,x1,...,xkgözlemlenirse, modeli OLS ile tahmin edebiliriz. Ölçüm hatasıy her bir açıklayıcı değişkenten istatistiksel olarak bağımsız, (e+ε) ile aynı özellikleri paylaşır ε ve olağan OLS çıkarım prosedürleri (tistatistikler vb.) geçerlidir. Ancak, sizin durumunuzda,e. Kullanabilirsin:
  • ağırlıklı bir en küçük kareler kestirimcisi (örneğin Kutner ve diğerleri , §11.1 ; Verbeek , §4.3.1-3);

  • hala tarafsız ve tutarlı OLS tahmincisi ve heteroskedastisite tutarlı standart hatalar veya basitçe Wite standart hatalar ( Verbeek , §4.3.4).

Bağımsız değişkente ölçüm hatası

Yukarıdaki ile aynı doğrusal model göz önüne alındığında, xk* "doğru" değeri belirtmek ve xkgözlemlenebilir ölçüsüdür. Ölçüm hatası şimdi:

ek=xk-xk*
İki ana durum vardır ( Wooldridge , §4.4.2).
  • Cov(xk,ek)=0: ölçüm hatası, gözlemlenen ölçü ile ilişkisizdir ve bu nedenle gözlemlenmeyen değişken ile ilişkilendirilmelidir xk*; yazıxk*=xk-ek ve bunu (1) 'e takarak:

    y=β0+β1x1++βkxk+(ε-βkek)
    dan beri ε ve e her ikisi de her biri ile ilişkisiz xj, dahil olmak üzere xk, ölçüm sadece hata varyansını artırır ve OLS varsayımlarının hiçbirini ihlal etmez;
  • Cov(xk*,ηk)=0: ölçüm hatası gözlemlenmeyen değişken ile ilişkisizdir ve bu nedenle gözlemlenen ölçü ile ilişkilendirilmelidir. xk; böyle bir korelasyon prolemlere ve OLS regresyonuna neden olur.y üzerinde x1,...,xk genellikle önyargılı ve tutarsız tahmin ediciler verir.

Planınıza bakarak (bağımsız değişkenin "gerçek" değerlerinde ortalanmış hatalar) tahmin edebildiğim kadarıyla, ilk senaryo geçerli olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.