İlk sorunuzu cevaplamak için , örnek seçiminin belirli bir endojenite biçimi olduğu konusunda haklısınız (endojenite ve yaygın ilaçların iyi bir temel incelemesi için Antonakis ve ark., 2010'a bakınız), ancak tedavi edilme olasılığının doğru olduğunu söylemezsiniz. endojen değişkendir, çünkü tedavi seçiminin kendisi ("rastgele olmayan tedavi ataması") - tedavi edilme olasılığı yerine - örnek seçiminde endojendir. Endojenitenin, gözlemlenen “ilişki” aslında hem X hem de Y'yi etkileyen başka bir faktör Z'den kaynaklandığı zaman, faktör X ile faktör Y arasında yanlış bir nedensel ilişki tanımladığınız bir duruma işaret ettiğini hatırlayın. :
yi=β0+β1xi+...+ϵi
endojenite, öngörücülerinizin biri veya birden fazlası modeldeki hata terimiyle ilişkili olduğunda ortaya çıkar. Yani, .Cov(x,ϵ)≠0
Endojenitenin ortak nedenleri şunlardır:
- Atlanan değişkenler (ölçemediğimiz bazı şeyler)
- Motivasyon / seçim
- Yetenek / yetenek
- Kendinden seçimi
- Ölçüm hatası
(biz dahil etmek istiyoruz , ama sadece gözlemlemek x j * )xjxj∗
- Eşzamanlılık / çift yönlülük (5 yaşın altındaki çocuklarda, beslenme durumu göstergesi “yaş için ağırlık” ile çocuğun yakın tarihli bir hastalığı olup olmadığı arasındaki ilişki eşzamanlı olabilir.
Farklı problem türleri, IV ve Heckman tipi düzeltmeler arasındaki farkın yattığı hafif farklı çözümler gerektirir. Tabii ki bu yöntemlerin altında yatan mekanizmada farklılıklar vardır, ancak öncül aynıdır: endojenliği, ideal olarak bir dışlama kısıtlaması, yani IV durumunda bir veya daha fazla araç veya seçimi etkileyen bir değişken Heckman davasında sonuç.
İkinci sorunuzu cevaplamak için , bu çözümlerin geliştirilmesine yol açan veri sınırlama türlerindeki farklılıkları düşünmelisiniz. Enstrümantal değişken (IV) yaklaşımının bir veya daha fazla değişken endojen olduğunda kullanıldığını ve endojenliği gidermek için modele yapışacak iyi bir vekilin bulunmadığını düşünüyorum, ancak tüm gözlemler için ortak değişkenler ve sonuçlar gözlemlendi. Heckman tipi düzeltmeler ise, kısaltmanız olduğunda kullanılır, yani seçim değişkeninin değerinin == 0 olduğu örnekte bilgi gözlenmez.
Enstrümantal değişken (IV) yaklaşımı
İki aşamalı en küçük kareler (2SLS) tahmincisi ile IV regresyonu için klasik ekonometrik örneği düşünün: eğitimin kazançlar üzerindeki etkisi.
(1)Earningsi=β0+β1OwnEdi+ϵi
Burada eğitimsel başarı düzeyi endojendir, çünkü kısmen bireyin motivasyonu ve yeteneği tarafından belirlenir, her ikisi de bir kişinin kazancını etkiler. Motivasyon ve Yetenek tipik olarak hanehalkı veya ekonomik araştırmalarda ölçülmez. Dolayısıyla denklem 1, motivasyon ve kabiliyeti açıkça içerecek şekilde yazılabilir:
(2)Earningsi=β0+{β1OwnEdi+β2Motivi+β3Abili}+ϵi
Yana ve bir b i l aslında şu şekilde yazılabilir Denklem 2, gözlenmez:MotivAbil
(3),Earningsi=β0+β1OwnEdi+ui
burada (4).ui=β2Motivi+β3Abili+ϵi
Bu nedenle, eğitimin OLS yoluyla kazançlar üzerindeki etkisinin naif bir tahmini önyargılı olacaktır. Bu kısmı zaten biliyorsun.
Geçmişte, insanlar ebeveynlerin eğitimini konunun kendi eğitim seviyesi için araç olarak kullanmışlardır, çünkü geçerli bir araç için 3 gereksinime uymaktadırlar ( ):z
- endojen prediktör ile ilişkili olmalıdır - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) ≠ 0 ,zCov(z,x)≠0
- sonuçla doğrudan ilişkili olamaz - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0 vezCov(z,y)=0
- ölçülemez (u) karakteristik ile ilişkilendirilemez (yani z dışsaldır ) - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0zzCov(z,u)=0
Öznenin eğitimini ( ) ilk aşamada ebeveynlerin eğitimini ( M o M E d ve D a d E d ) kullanarak tahmin ettiğinizde ve öngörülen eğitim değerini ( ^OwnEdMomEdDadEd ) kullandığınızdaEarningsikinci aşamada, (çok basit terimlerle),EarningskısmınıOwnEdˆEarningsEarnings motivasyon / yeteneği ile belirlenmez.OwnEd
Heckman tipi düzeltmeler
Daha önce belirlediğimiz gibi, rastgele olmayan örnek seçimi spesifik bir endojenite türüdür. Bu durumda, atlanan değişken insanların numuneye nasıl seçildiğidir. Tipik olarak, bir numune seçim probleminiz olduğunda, sonucunuz sadece numune seçimini yapanlar için gözlemlenir variable == 1
. Bu sorun aynı zamanda "tesadüfi kesme" olarak bilinir ve çözüm genellikle Heckman düzeltmesi olarak bilinir. Ekonometride klasik örnek, evli kadınların ücret teklifidir:
(5 )Wagei=β0+β1Educi+β2Experiencei+β3Experience2i+ϵi
Buradaki sorun, sadece ücret için çalışan kadınlar için gözlemlenmesidir, bu nedenle, işgücüne katılmayanlar için ücret teklifinin ne olduğunu bilmediğimiz için saf bir tahminci önyargılı olacaktır. değişken s . Denklem 5, iki gizli model tarafından ortaklaşa belirlendiğini göstermek için yeniden yazılabilir:Wages
(6)Wage∗i=Xβ′+ϵi
(7)LaborForce∗i=Zγ′+νi
Yani, IFF L a b o r F o r c e ∗ i > 0 ve W a g e =Wage=Wage∗iLaborForce∗i>0IFF L a b o r F o r c e ∗ i ≤ 0Wage=.LaborForce∗i≤0
Burada çözelti, tahmin Mills ters oranı (hesaplamak Probit modeli ve dışlama kısıtlama (geçerli araçlar için aynı kriterler burada da geçerlidir) kullanılarak birinci aşamada işgücüne katılma ihtimalini öngörmek için nedenle λ her gözlem için) ve ikinci aşamada, ücret teklifiniλ^ modelinde bir göstergesi olarak (2009 Wooldridge). Üzerinde katsayısı ise X sıfıra istatistiksel eşittir, orada örneklem seçim (içselliğinin) hiçbir kanıt olduğunu ve OLS sonuçları tutarlı ve sunulabilir. Eğer üzerinde katsayı Xλ^λ^λ^ istatistiksel olarak sıfırdan önemli ölçüde farklıysa, düzeltilmiş modelden katsayıları bildirmeniz gerekir.
Referanslar
- Antonakis, John, Samuel Bendahan, Philippe Jacquart ve Rafael Lalive. 2010. “Nedensel İddialarda Bulunulması : Bir Gözden Geçirme ve Öneriler.” Üç Aylık Liderlik 21 (6): 1086–1120. doi: 10.1016 / j.leaqua.2010.10.010.
- Wooldridge, Jeffrey M. 2009. Giriş Ekonometrisi: Modern Bir Yaklaşım. 4. baskı. Mason, OH, ABD: Güney-Batı, Cengage Öğrenme.