Bu konuyu oldukça ilginç buluyorum ve şu anki cevaplar ne yazık ki eksik ya da kısmen yanıltıcı - bu sorunun uygunluğuna ve popülerliğine rağmen.
Klasik en küçük kareler çerçevesinin Tanıma göre olmalıdır arasında bir ilişkiveŷ u^ elde artıklar ile ilintisiz yapı başına olduğundan, OLS tahmin Homoskedastisite altındaki özelliği minimize eden değişkenlik, kalıntı hatanın rastgele verilen değerlerin etrafına rastgele yayılmasını sağlar. Bu resmi olarak gösterilebilir:ŷ
= P σ 2 - P σ 2 = 0
Cov(ŷ ,û |X)=Cov(Py,My|X)=Cov(Py,(I−P)y|X)=PCov(y,y)(I−P)′
=Pσ2−Pσ2=0
Burada ve : olarak tanımlanan İdempotent matrisleridir ve .MPP=X(X′X)X′M=I−P
Bu sonuç kesin dışsallığa ve eşcinselliğe dayanır ve pratikte büyük örneklerde bulunur. Bunların uncorrelatedness için sezgi şudur: edilen değerikoşullu üzerinde çevresinde ortalanır olarak Ancak, sıkı eksojenite ve homoskedasticity varsayımından herhangi bir sapma açıklayıcı değişkenler endojen olmasına neden arasında bir gizli ilişki hızlandıracağıve. ŷ Xû û ŷ
Şimdi artıklar arasındaki korelasyonve "orijinal" bambaşka bir hikaye:û y
Cov(y,û |X)=Cov(yMy|X)=Cov(y,(1−P)y)=Cov(y,y)(1−P)=σ2M
Teoride bazı kontroller ve bu kovaryans matrisinin artık nın kovaryans matrisi ile aynı olduğunu biliyoruz (kanıt ihmal edilmiştir). Sahibiz:u^
Var(û )=σ2M=Cov(y,û |X)
OP'nin istediği şekilde ve arasındaki (skaler) kovaryansı hesaplamak istiyorsak , aşağıdakileri elde ederiz:yu^
⟹Covscalar(y,û |X)=Var(û |X)=(∑u2i)/N
(= kovaryans matrisinin köşegen girişlerini toplayarak ve N'ye bölerek)
Yukarıdaki formül ilginç bir noktaya işaret ediyor. Eğer ilişkiyi (+ sabiti) artıklarında gerilemesiyle test edersek, yukarıdaki ifadeyi böldüğümüzde kolayca elde edilebilecek eğim katsayısı olur. .yu^βu^,y=1Var(û |X)
Öte yandan, korelasyon, ilgili standart sapmalarla standart kovaryanstır. Şimdi, artıklar varyans matrisi varyansı ise, olan . Bu nedenle korelasyonu şu şekilde olur:σ2Myσ2ICorr(y,û )
Corr(y,û )=Var(û )Var(u^)Var(y)−−−−−−−−−−−√=Var(û )Var(y)−−−−−−√=Var(û )σ2−−−−−−√
Bu, doğrusal bir regresyonda tutması gereken temel sonuçtur. Sezgi, hata teriminin gerçek varyansı ile artıklara dayanan varyans için bir proxy arasındaki hatayı ifade eder. Varyansı olduğuna dikkat edin varyansı eşittir artı artıkların varyans . Bu nedenle, daha sezgisel olarak şu şekilde yeniden yazılabilir:Corr(y,û )yy^u^
Corr(y,û )=11+Var(y)^Var(û )−−−−−−−−√
Burada işte iki güç var. Regresyon çizgisine çok uyuyorsak, korelasyonun olması nedeniyle düşük olması beklenir . Öte yandan, koşulsuz olduğu ve parametre alanında bir satır olduğu için saygılı bir parça. Koşulsuz ve koşullu varyansların bir oran içinde karşılaştırılması sonuçta uygun bir gösterge olmayabilir. Belki de bu yüzden pratikte nadiren yapılır.Var(û )≈0Var(y^)
Denemesi soru sonucuna: arasındaki korelasyonu vepozitiftir ve koşulsuz varyans ile temsil artıklar varyansı ve gerçek hata teriminin varyans oranı ile ilgilidir . Bu nedenle, biraz yanıltıcı bir göstergedir.yû y
Bu egzersiz bize işleyişi ve OLS regresyon doğasında teorik varsayımlara bazı sezgi verebilir rağmen, nadiren arasındaki korelasyonu değerlendirmek ve. Gerçek hata teriminin özelliklerini kontrol etmek için kesinlikle daha yerleşik testler vardır. İkincisi, kalıntılar artıklar üzerinde testler hata terimi değildir ve unutmayın gerçek hata terimine özelliklerinin marka tahminleri özenle ele alınması ile sınırlıdır ve bunların geçerlilik ihtiyacı.yû û u
Örneğin, burada önceki bir poster tarafından yapılan bir ifadeye dikkat çekmek istiyorum. Şöyle söylenir,
"Artıklarınız bağımsız değişkenlerinizle ilişkiliyse, modeliniz heteroskedastic ..."
Bunun bu bağlamda tamamen geçerli olmayabileceğini düşünüyorum. İster inanın ister inanmayın, ama EKK kalıntılar inşaat tarafından bağımsız değişkenler ile ilişkisiz olması için yapılan . Bunu görmek için düşünün:û xk
X′ui=X′My=X′(I−P)y=X′y−X′Py
=X′y−X′X(X′X)X′y=X′y−X′y=0
⟹X′ui=0⟹Cov(X′,ui|X)=0⟹Cov(xki,ui|xki)=0
Ancak, açıklayıcı bir değişkenin hata terimiyle ilişkili olduğunu iddia etmiş olabilirsiniz . Uyarı gibi iddiaların tamamı hakkında varsayımlara dayandığını nüfusun biz emin, gerçek bir temel regresyon modeli ile değil ilk elden gözlemlemek. Sonuç olarak, arasındaki korelasyonu kontrol ve doğrusal EKK çerçevesinde anlamsız Bununla birlikte, heteroskedastisite testi yapılırken , burada ikinci koşullu momenti göz önünde bulundururuz; örneğin, üzerindeki kare kalıntıları veya bir fonksiyonunuyû XXFGSL tahmin edicilerinde sıklıkla olduğu gibi. Bu, düz korelasyonu değerlendirmekten farklıdır. Umarım bu, meseleleri daha net hale getirmeye yardımcı olur.