Koşullu ortalama bağımsızlık, OLS tahmincisinin tarafsızlığını ve tutarlılığını ima eder


10

Aşağıdaki çoklu regresyon modelini düşünün:

(1)Y=Xβ+Zδ+U.

Burada , bir sütun vektörüdür; bir matrisi; a sütun vektörü; a matrisi; a sütun vektörü; ve , hata terimi, bir sütun vektörü.Yn×1Xn×(k+1)β(k+1)×1Zn×lδl×1Un×1


SORU

Öğretim görevlim, Ekonometriye Giriş ders kitabı , 3. baskı. James H. Stock ve Mark W. Watson, s. 281 ve Ekonometri: Onur Sınavı İnceleme Oturumu (PDF) , s. 7, bana şunu ifade etti.

  1. Koşullu ortalama bağımsızlık olarak adlandırılan şeyi varsayarsak , tanım gereği
    (2)E(U|X,Z)=E(U|Z),
  2. ve en küçük kareler varsayımı koşullu ortalama sıfır varsayımı dışında tatmin edildiyse (yani olduğunu varsayıyoruz ) (bkz. 1 Aşağıda -3),E(U|X,Z)=0E(U|X,Z)=E(U|Z)0

  3. daha sonra, deki OLS tahmincisi , bu daha zayıf varsayımlar altında tarafsız ve tutarlı kalır .β^β(1)

Bu teklifi nasıl kanıtlarım? Yani, 1 ve 2 yukarıdaki OLS tahmin olduğunu ima bize yönelik tarafsız ve tutarlı tahmin edicisi verir ? Bu öneriyi kanıtlayan bir araştırma makalesi var mı?ββ


YORUM YAP

En basit durum, doğrusal regresyon modeli ve OLS tahmini / , her için ise tarafsızdır .

Yi=β0+β1Xi+β2Zi+ui,i=1,2,,n,
β 1 β 1 e ( u ı | X i , Z ı ) = E ( u ı | Z i ) iβ^1β1E(ui|Xi,Zi)=E(ui|Zi)i

Varsayarak Yansızlık BELGESİ VE BİRLİKTE normal olarak dağılanUiZi

, ardından ve tanımlayınDolayısıyla şu şekilde yazılabilir olabilir tarafından daha sonra bu, aşağıdaki Şimdi, ve birlikte normal olarak dağıtıldığından, normal dağılımlar teorisi, bkz. Çok değişkenli normal dağılımın koşullu dağılımları türetilmesi diyor ki (aslında, biz ortak normalliği ama sadece bu kimliği varsaymak gerekmez) bazıları için tarafından vektörV=UE(U|X,Z)U=V+E(U|X,Z)

(*)E(V|X,Z)=0.
(1)
(3)Y=Xβ+Zδ+E(U|X,Z)+V.
(2)
(4)Y=Xβ+Zδ+E(U|Z)+V.
UiZi E ( U | Z ) = Z γ l1γ0
(**)E(U|Z)=Zγ
l1γ0 .

Şimdi haline gelir modeli için hata terimi olarak tatmin tüm en küçük kareler varsayımı, tatmin koşullu varsayımı ortalama sıfır. Bu durum, OLS tahmin ima ve biz izin halinde için tarafsız olacak ve izin olmak ile oluşan matris ve , daha sonra OLS tahmin olarak aşağıdaki göz önünde bulundurularak verilir:(4)

(5)Y=Xβ+Z(δ+γ)+V.
(5)Vβ β ρ = δ + γ W = ( X , Z ) n ( k + 1 ) + L X- Z, β ( 5 ) ( β T , ρ T ) Tβ^βρ=δ+γW=(X,Z)n(k+1)+lXZβ(5)
(β^T,ρ^T)T=(WTW)1WTY=(WTW)1WT(W(βT,ρT)T+V)=(βT,ρT)T+(WTW)1WTV

ve böylece ; burada ikinci satır . Bu nedenle , model için yapılan OLS tahmini , model için verilenle birlikte OLS tahmini olduğundan, koşullu olarak tarafsız bir tahminidir . Şimdi, toplam beklenti yasası ile ve dolayısıyla için tarafsız bir tahmin .

E((β^T,ρ^T)T|W)=(βT,ρT)T+(WTW)1WsTE(V|W)=(βT,ρT)T+(WTW)1WT0=(βT,ρT)T,
() β β(1)(5) D ( β )β^β(1)(5)
E(β^)=E(E(β^|W))=E(β)=β,
β ββ^β

( , böylece katsayı mutlaka tarafsız değildir.)E(ρ^)=ρ=δ+γδZ

Bununla birlikte, yukarıdaki özel durum ve normal olarak müştereken varsayar, bu varsayım olmadan teklifi nasıl kanıtlayabilirim?UiZi

her zaman elbette yeterli olduğunu varsayarsak çapraz başvuru ), ancak sonucu sadece ve Koşullu Ortalama Sıfır varsayımı ( aşağıya bakınız).E(U|Z)=Zγ()(2)

SIKLIĞA İLİŞKİN

Bir de tahmin olduğunu görebilirsiniz düşünüyorum için tutarlı regresyon modelinde olduğu fark ile varsayımı dahil tüm en küçük kareler varsayımı yerine getirdiğinin (yeni) hata terimi tatmin Koşullu Ortalama Sıfır varsayımı (bkz. Ve aşağıya bakınız).β^β(5)V()

Daha sonra, Ekonometriye Giriş, 3. Baskı , bir dizi alıştırmalara dayanan bir tutarlılık kanıtı ekleyebilirim . James H. Stock ve Mark W. Watson, ch. 18. Ancak, bu kanıt oldukça uzundur. Ancak buradaki nokta, alıştırmalarda sağlanan kanıtın olduğunu varsaydığından , varsayımın gerçekten yeterli olup olmadığını hala merak ediyorum .()(2)

YALNIZ 1

In Ekonometri, 3rd ed giriş. James H. Stock ve Mark W. Watson tarafından, s. 300'de, varsayım doğrusal olmayan regresyon teorisi kullanılarak "gevşetilebilir". Bununla ne kastediyorlar veya kastetebilirler?()

EN AZ KARE VARSAYIMLARI

Burada , kanıtlamaya çalıştığımız öneri olan durumlarda izin verdiği için koşullu ortalama sıfır varsayımını hariç . Bunlar, örneğin, , ile korele olduğu durumlardır . Krş Ekonometri: Onur Sınavı İnceleme Oturumu (PDF) , s. 7.E(U|X,Z)=0E(U|X,Z)0ZU

En küçük kareler varsayımı aşağıdaki gibidir.

  1. Ortak dağılımları , burada, iid olan : inci elemanı ve ve olan inci satır vektörleri: ve .(Yi,Xi,Zi)i=1,2,,n,YiiYXiZiiXZ

  2. Büyük aykırı her biri için, yani olası değildir , ve nerede, sonlu dördüncü anlar var olduğu içinde inci eleman: .iXi,ZiUiUiiU

  3. (X,Z) tam sütun sırasına sahiptir (yani, mükemmel bir çoklu doğrusallık yoktur; bu ters çevrilebilirliğini sağlar ).WTW

  4. ( Genişletilmiş en küçük kareler varsayımları : Bunun gerekli olduğunu düşünmüyorum (ve bana öyle olmadığı söylenmişti), aynı zamanda homoskedasticity'yi de alabiliriz, yani Her için ve verilen koşullu dağılımı her için normaldir (yani, normal hatalarımız vardır.))Var(Ui|Xi,Zi)=σU2iUi(Xi,Zi)i

TERMİNOLOJİ HAKKINDA NOT

İçinde , Koşullu ortalama sıfır varsayımı varsayımıdır . Ancak Koşullu Ortalama Bağımsızlık varsayımı, olduğu varsayımıdır .(1)E(U|X,Z)=0E(U|X,Z)=E(U|Z)

Bu terminoloji, örneğin Ekonometriye Giriş, 3. Baskı. James H. Stock ve Mark W. Watson, s. 281; ve Kesit ve Panel Verilerinin Ekonometrik Analizi, 1. Baskı. yazan Jeffrey M. Wooldridge, s. 607. Benzer tartışmalar için ayrıca bkz. Koşullu Bağımsızlık Kısıtlamaları: Test ve Tahmin .

İLAVE DÜŞÜNCELER VE YANIT 2

James H. Stock ve Mark W. Watson'ın aksine, koşullu ortalama bağımsızlığın tarafsız bir OLS tahminini sağlamadığını düşünüyorum . Bunun nedeni, gibi doğrusal olmayan biçimler alabilir bir polinomdur ya da henüz tahmin edilecek bazı parametredir (burada kullanıyorum matris üstel ) ve daha sonra, sanırım, doğrusal olmayan regresyon önyargılı tahminler hangi genellikle yaprakları bize, uygulanmak zorundadır. Ayrıca, (1) OLS tahmini, OLS tahmini ile bile çakışmayabilirβE(U|Z)E(U|Z)=p(Z)p(Z)ZE(U|Z)=exp(Zγ)γβ β ( 4 ) E ( U | Z )ββiçinde eğer bazı doğrusal olmayan biçimler alır. (Psikolojik olarak Stock & Watson tarafından kitapta yapılan ifadenin gerçek olamayacak kadar iyi olduğunu düşünüyorum.)(4)E(U|Z)

Dolayısıyla, ek bir soru koşullu ortalama bağımsızlığın tarafsız OLS tahminine yol açtığına dair bir karşı örnek olup olmadığıdır.

ARTIŞ 3

Gelen Çoğunlukla zararsız Ekonometrisi Angrist ve Pischke alt 3.3, s savunur. 68-91, koşullu bağımsızlık (CI), yani verilen bağımsız olması (bu, yukarıda verilen koşullu ortalama bağımsızlık varsayımından daha güçlü bir koşul, sanırım, yukarıda verilen koşullu ortalama bağımsızlık varsayımı) arasında sıkı bir bağlantı olduğunu etkisi ile ve katsayıları gerilemesinde ile ve CI altında en küçük kareler ile katsayısı tahmin etmektedir motive eder inYXWXYXYXWX(1) CI tutmadığından daha az önyargılıdır (diğer her şey eşittir).

Şimdi, bu fikir bir şekilde ana sorumu cevaplamak için kullanılabilir mi?


@ Xi'an Ne demek istiyorsun? Bu benim kitabında verilen şartlı ortalama bağımsızlık tanımı şöyledir: Eğer biz doğrusal regresyonda sahip , o zaman demek koşullu ortalama bağımsızlığımız var. Yazma şeklimin daha genel olduğunu düşündüm. E ( u i | X i , Z i ) = E ( u i | Z i )Yi=β0+β1Xi+β2Zi+uiE(ui|Xi,Zi)=E(ui|Zi)
Elias

@ Xi'an Bu durumda "şartlı bağımsız $ ce" yi nasıl tanımlarsınız? Düşündüğüm gibi, "koşullu bağımsızlık", "koşullu ortalama bağımsızlık" tan farklı bir kavramdır. Kavramsal olarak bağlantılı olabilir veya olmayabilir.
Elias

@ Xi'an Kavramları anlamanın yolu budur: Koşullu bağımsızlık sadece , ancak koşullu ortalama bağımsızlık . E ( A | B , C ) = E ( A | C )P(AB|C)=P(A|C)P(B|C)E(A|B,C)=E(A|C)
Elias

Xi'an yorumu nerede?
Michael R. Chernick

@MichaelChernick İlk yorumu. Sanırım onu ​​silmiş olmalı. Hatırladığım gibi, koşullu bağımsızlık anlamına gelmediğini söyledi ve cevapladım. E(U|X,Z)=E(U|Z)
Elias

Yanıtlar:


4

Bu yanlış. Gözlemlediğiniz gibi, Stock ve Watson'ı yakından okursanız, OLS'nin koşullu ortalama bağımsızlık altında için tarafsız olduğu iddiasını gerçekten onaylamazlar . ise OLS'un için tarafsız olduğu iddiasını daha fazla kabul ederler . Sonra, doğrusal olmayan en küçük kareler hakkında belirsiz bir şey söylüyorlar.β E ( u | x , z ) = z γββE(u|x,z)=zγ

Denkleminiz (4), iddianın yanlış olduğunu görmek için ihtiyacınız olanı içerir. değişkenini atlarken Denklem (4) 'ün OLS ile hesaplanması atlanan değişkenlerin sapmasına yol açar. Muhtemelen hatırladığınız gibi, atlanan değişkenlerden önyargı terimi (atlanan değişken 1 katsayısına sahip olduğunda), aşağıdaki yardımcı regresyon katsayıları tarafından kontrol edilir: orijinal regresyon yanlılık olan bu regresyondan ve üzerindeki bastırma isimli . Eğer ile ilişkilidir kontrol edildikten sonra, doğrusal içinE ( u | z ) = x α 1 + z α 2 + ν β α 1 γ α 2 x E ( u | z ) z α 1E(u|x,z)

E(u|z)=xα1+zα2+ν
βα1γα2xE(u|z)z , ardından sıfırdan farklı olur ve OLS katsayısı yanlı olacaktır.α1

İşte noktayı kanıtlamak için bir örnek:

ξF(),ζG(),νH()all independentz=ξx=z2+ζu=z+z2E(z+z2)+ν

Formül bakıldığında , açıktır yardımcı regresyon bakıldığında, açık (tesadüfi seçimi yoksa ) sıfır olmayacaktır.E ( u | x , z ) = E ( u | z ) = z + z 2 - E ( z + z 2 ) F , G , H α 1uE(u|x,z)=E(u|z)=z+z2E(z+z2)F,G,Hα1

İşte Rnoktayı gösteren çok basit bir örnek :

set.seed(12344321)
z <- runif(n=100000,min=0,max=10)
x <- z^2 + runif(n=100000,min=0,max=20)
u <- z + z^2 - mean(z+z^2) + rnorm(n=100000,mean=0,sd=20)
y <- x + z + u

summary(lm(y~x+z))

# auxiliary regression
summary(lm(z+z^2~x+z))

İlk regresyon size bir katsayı verdiği Bildirimi gerçeğini yansıtan 0.63 tarafından bastırıldığı "bazılarına sahiptir olduğu gibi onun içinde" . Ayrıca, yardımcı regresyonun yaklaşık 0.63'lük bir yanlılık tahmini verdiğine dikkat edin.x z 2 E ( u | z )xxz2E(u|z)

Peki, Stock ve Watson (ve öğretim görevliniz) ne hakkında konuşuyor? Denkleminize geri dönelim (4):

y=xβ+zγ+E(u|z)+v

Atlanan değişkenin sadece bir fonksiyonu olması önemli bir gerçektir . Görünüşe göre gerçekten iyi kontrol edebilirsek , , ile ilişkili olsa bile, sapmayı regresyondan temizlemek için yeterli olacaktır .zzxu

Aşağıdaki denklemi işlevini tahmin etmek için parametrik olmayan bir yöntem kullanarak veya doğru fonksiyonel form kullanarak tahmin ettiğimizi varsayalım . Doğru fonksiyonel formu kullanıyor olsaydık, bunu doğrusal olmayan en küçük karelerle (NLS hakkındaki şifreli yorumu açıklayarak) tahmin ederdik: Artık bize atlanan değişken bir sorun olmadığı için için tutarlı bir tahminci verebiliriz . f()f(z)=zγ+E(u|z)

y=xβ+f(z)+v
β

Alternatif olarak, yeterli veriye sahip olsaydık, kontrolünde `` sonuna kadar '' gidebiliriz . Verilerin bir alt kümesine bakabiliriz; burada ve sadece regresyonu çalıştırabiliriz: Bu, için aşağıdakiler hariç tarafsız, tutarlı tahminciler verir tabii ki tarafından kirletilecek olan engel . Açıkçası, bu regresyonu sadece olan veri noktalarında çalıştırarak (farklı) tutarlı, tarafsız bir tahminci de alabilirsiniz . Ve diğeri olan noktalar için . Vb O zaman, bir şekilde hep birlikte ortalamayı alarak, büyük bir tahminci yapabileceğiniz bir sürü iyi tahmin ediciniz olur.zz=1

y=xβ+v
βf(1)z=2z=3

Bu ikinci düşünce, eşleşen tahmin ediciler için ilham kaynağıdır. Anlamıyla sadece regresyon çalıştırmak için genellikle yeterli veri olmadığı için ya da nokta çiftleri için aynıdır, bunun yerine noktaları için regresyon çalıştırmak `` yeterince yakın 'aynıdır etmektir.z=1zz


3

Bu sonucu kanıtlayamazsınız çünkü genel ifadesinde doğru değildir. Denkleminizdeki modelle başlayın. (4)

Y=Xβ+Zδ+(E(U|Z)+V)

burada büyük parantez gerçek hata terimini belirtir (henüz koşullu beklenti üzerinde varsayım yok). Simetrik, idempotent olan ve ayrıca olan tortu oluşturucu veya yok edici matrisini . MZ=IZ(ZZ)1ZMZZ=0

"Ayrılmış regresyon sonuçları" ile

β^OLSβ=(XMZX)1XMZZδ+(XMZX)1XMZE(UZ)+(XMZX)1XMZV

Sağdaki ilk terim zaten sıfır. Beklenen değeri baştan alarak ve sonra kule özelliğini koşullu beklenti için uygulayarak, üçüncü terim de sıfır olacaktır (koşullu ortalama bağımsızlığını daha zayıf formunda kullanarak). Ama bu daha zayıf varsayımın bizi götürdüğü kadar, çünkü

E(β^OLS)β=E[(XMZX)1XMZE(UZ)]

İçin sapmasızlık biz sağ taraf sıfır olmasını istiyorum. Bu tutacaktır bir doğrusal fonksiyonudur (siz de bulduğumuz gibi) tekrar sıfır elde edecek çünkü . Ancak aksi takdirde, beklenen değerin tamamının doğrudan olduğunu varsaymak tamamen keyfi bir durumdur. Ortak normalliği kabul etmek zorunda değiliz, ancak bu koşullu beklentinin doğrusallığını varsaymalıyız (diğer dağıtımlar da bu özelliğe sahiptir). Sapmasızlık ait için gerekli varsayımı Yani olduğunuE(UZ)ZMZZ
β

E(UX,Z)=E(UZ)=Zγ

ve tüm regresörlerin katı dışsallığına kıyasla gerçekten "zayıf" olup olmadığını söyleyemem (çünkü katı dışsallık, tüm dağıtım varsayımları için ortalama bağımsızlık olarak belirtildiğinden , burada ve takip).UZ

Bu doğrusallık varsayımı altında da tutarlı olacağını göstermek zor değildir .β^OLS


Güzel cevap! Bunu uzun zaman önce okudum ve daha sonra düşüneceğimi düşündüm. Bazı sorularım var: Bölümlenmiş regresyon sonuçlarınızı nasıl kanıtlayabilirsiniz? En azından bir referansı takdir ediyorum. Ayrıca, ve arasındaki fark ? M zMZMz
Elias

1
@Monir ve sadece bir yazım hatasıdır . Bölümlenmiş regresyon sonuçları (çok eski ve standart olan) için, sıradan en küçük kareler tahmininin cebirsel yönünü tartıştığı bölümde, örneğin Greene tarafından Ekonometri ders kitabına bakınız. Kanıtı içerir. zZz
Alecos Papadopoulos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.