İki aşamalı modeller: Heckman modelleri (örnek seçimi ile ilgilenmek için) ve Enstrümantal değişkenler (endojenite ile ilgilenmek için) arasındaki fark


16

Başımı örnek seçimi ve endojenite arasındaki fark etrafında toplamaya çalışıyorum ve Heckman modellerinin (örnek seçimi ile başa çıkmak için) enstrümantal değişken regresyonlardan (endojenlik ile başa çıkmak için) nasıl farklı olduğunu düşünüyorum.

Örnek seçiminin, endojen değişkenin tedavi edilme olasılığı olduğu belirli bir endojenite formu olduğunu söylemek doğru mudur?

Ayrıca, hem Heckman modellerinin hem de IV regresyonunun, ilk aşamanın tedavi edilme olasılığını öngördüğü 2 aşamalı modeller olduğu anlaşılıyor - sanırım deneysel olarak ne yaptıklarına, hedeflerine ve varsayımlarına göre farklılık göstermeleri gerekiyor, ama nasıl?

Yanıtlar:


23

İlk sorunuzu cevaplamak için , örnek seçiminin belirli bir endojenite biçimi olduğu konusunda haklısınız (endojenite ve yaygın ilaçların iyi bir temel incelemesi için Antonakis ve ark., 2010'a bakınız), ancak tedavi edilme olasılığının doğru olduğunu söylemezsiniz. endojen değişkendir, çünkü tedavi seçiminin kendisi ("rastgele olmayan tedavi ataması") - tedavi edilme olasılığı yerine - örnek seçiminde endojendir. Endojenitenin, gözlemlenen “ilişki” aslında hem X hem de Y'yi etkileyen başka bir faktör Z'den kaynaklandığı zaman, faktör X ile faktör Y arasında yanlış bir nedensel ilişki tanımladığınız bir duruma işaret ettiğini hatırlayın. :

yi=β0+β1xi+...+ϵi

endojenite, öngörücülerinizin biri veya birden fazlası modeldeki hata terimiyle ilişkili olduğunda ortaya çıkar. Yani, .Cov(x,ϵ)0

Endojenitenin ortak nedenleri şunlardır:

  1. Atlanan değişkenler (ölçemediğimiz bazı şeyler)
    • Motivasyon / seçim
    • Yetenek / yetenek
    • Kendinden seçimi
  2. Ölçüm hatası (biz dahil etmek istiyoruz , ama sadece gözlemlemek x j * )xjxj
  3. Eşzamanlılık / çift yönlülük (5 yaşın altındaki çocuklarda, beslenme durumu göstergesi “yaş için ağırlık” ile çocuğun yakın tarihli bir hastalığı olup olmadığı arasındaki ilişki eşzamanlı olabilir.

Farklı problem türleri, IV ve Heckman tipi düzeltmeler arasındaki farkın yattığı hafif farklı çözümler gerektirir. Tabii ki bu yöntemlerin altında yatan mekanizmada farklılıklar vardır, ancak öncül aynıdır: endojenliği, ideal olarak bir dışlama kısıtlaması, yani IV durumunda bir veya daha fazla araç veya seçimi etkileyen bir değişken Heckman davasında sonuç.

İkinci sorunuzu cevaplamak için , bu çözümlerin geliştirilmesine yol açan veri sınırlama türlerindeki farklılıkları düşünmelisiniz. Enstrümantal değişken (IV) yaklaşımının bir veya daha fazla değişken endojen olduğunda kullanıldığını ve endojenliği gidermek için modele yapışacak iyi bir vekilin bulunmadığını düşünüyorum, ancak tüm gözlemler için ortak değişkenler ve sonuçlar gözlemlendi. Heckman tipi düzeltmeler ise, kısaltmanız olduğunda kullanılır, yani seçim değişkeninin değerinin == 0 olduğu örnekte bilgi gözlenmez.

Enstrümantal değişken (IV) yaklaşımı

İki aşamalı en küçük kareler (2SLS) tahmincisi ile IV regresyonu için klasik ekonometrik örneği düşünün: eğitimin kazançlar üzerindeki etkisi.

(1)Earningsi=β0+β1OwnEdi+ϵi

Burada eğitimsel başarı düzeyi endojendir, çünkü kısmen bireyin motivasyonu ve yeteneği tarafından belirlenir, her ikisi de bir kişinin kazancını etkiler. Motivasyon ve Yetenek tipik olarak hanehalkı veya ekonomik araştırmalarda ölçülmez. Dolayısıyla denklem 1, motivasyon ve kabiliyeti açıkça içerecek şekilde yazılabilir:

(2)Earningsi=β0+{β1OwnEdi+β2Motivi+β3Abili}+ϵi

Yana ve bir b i l aslında şu şekilde yazılabilir Denklem 2, gözlenmez:MotivAbil

(3),Earningsi=β0+β1OwnEdi+ui

burada (4).ui=β2Motivi+β3Abili+ϵi

Bu nedenle, eğitimin OLS yoluyla kazançlar üzerindeki etkisinin naif bir tahmini önyargılı olacaktır. Bu kısmı zaten biliyorsun.

Geçmişte, insanlar ebeveynlerin eğitimini konunun kendi eğitim seviyesi için araç olarak kullanmışlardır, çünkü geçerli bir araç için 3 gereksinime uymaktadırlar ( ):z

  1. endojen prediktör ile ilişkili olmalıdır - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) 0 ,z𝐶𝑜𝑣(𝑧,𝑥)0
  2. sonuçla doğrudan ilişkili olamaz - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0 vez𝐶𝑜𝑣(𝑧,𝑦)=0
  3. ölçülemez (u) karakteristik ile ilişkilendirilemez (yani z dışsaldır ) - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0zz𝐶𝑜𝑣(𝑧,𝑢)=0

Öznenin eğitimini ( ) ilk aşamada ebeveynlerin eğitimini ( M o M E d ve D a d E d ) kullanarak tahmin ettiğinizde ve öngörülen eğitim değerini ( ^OwnEdMomEdDadEd ) kullandığınızdaEarningsikinci aşamada, (çok basit terimlerle),EarningskısmınıOwnEd^EarningsEarnings motivasyon / yeteneği ile belirlenmez.OwnEd

Heckman tipi düzeltmeler

Daha önce belirlediğimiz gibi, rastgele olmayan örnek seçimi spesifik bir endojenite türüdür. Bu durumda, atlanan değişken insanların numuneye nasıl seçildiğidir. Tipik olarak, bir numune seçim probleminiz olduğunda, sonucunuz sadece numune seçimini yapanlar için gözlemlenir variable == 1. Bu sorun aynı zamanda "tesadüfi kesme" olarak bilinir ve çözüm genellikle Heckman düzeltmesi olarak bilinir. Ekonometride klasik örnek, evli kadınların ücret teklifidir:

(5 )Wagei=β0+β1Educi+β2Experiencei+β3Experiencei2+ϵi

Buradaki sorun, sadece ücret için çalışan kadınlar için gözlemlenmesidir, bu nedenle, işgücüne katılmayanlar için ücret teklifinin ne olduğunu bilmediğimiz için saf bir tahminci önyargılı olacaktır. değişken s . Denklem 5, iki gizli model tarafından ortaklaşa belirlendiğini göstermek için yeniden yazılabilir:Wages

(6)Wagei=Xβ+ϵi

(7)LaborForcei=Zγ+νi

Yani, IFF L a b o r F o r c e i > 0 ve W a g e =Wage=WageiLaborForcei>0IFF L a b o r F o r c e i0Wage=.LaborForcei0

Burada çözelti, tahmin Mills ters oranı (hesaplamak Probit modeli ve dışlama kısıtlama (geçerli araçlar için aynı kriterler burada da geçerlidir) kullanılarak birinci aşamada işgücüne katılma ihtimalini öngörmek için nedenle λ her gözlem için) ve ikinci aşamada, ücret teklifiniλ^ modelinde bir göstergesi olarak (2009 Wooldridge). Üzerinde katsayısı ise X sıfıra istatistiksel eşittir, orada örneklem seçim (içselliğinin) hiçbir kanıt olduğunu ve OLS sonuçları tutarlı ve sunulabilir. Eğer üzerinde katsayı Xλ^λ^λ^ istatistiksel olarak sıfırdan önemli ölçüde farklıysa, düzeltilmiş modelden katsayıları bildirmeniz gerekir.

Referanslar

  1. Antonakis, John, Samuel Bendahan, Philippe Jacquart ve Rafael Lalive. 2010. “Nedensel İddialarda Bulunulması : Bir Gözden Geçirme ve Öneriler.” Üç Aylık Liderlik 21 (6): 1086–1120. doi: 10.1016 / j.leaqua.2010.10.010.
  2. Wooldridge, Jeffrey M. 2009. Giriş Ekonometrisi: Modern Bir Yaklaşım. 4. baskı. Mason, OH, ABD: Güney-Batı, Cengage Öğrenme.

1
Heckman tipi düzeltmede, her gözlem için ters Mills oran değerleri nasıl yorumlanır? Belirli bir anda çalışmayan nüfustan çalışacak kişi sayısının olduğunu söylüyor mu?
Quirik

2

Spesifik Heckman numune seçim modeli (sadece bir numunenin gözlendiği yerde) ile iki seçimin gözlemlendiği durumda da çalışabilen Heckman tipi kendi kendine seçim düzeltmeleri arasında bir ayrım yapılmalıdır . İkincisi kontrol fonksiyonu yaklaşımı olarak adlandırılır ve ikinci aşamaya endojenliği kontrol eden bir terim dahil etmek için tutarlar.

Endojen bir kukla değişken D olan bir enstrüman Z olan standart bir vakaya sahip olalım:

D

Y=β+β1D+ε
D=γ+γ1Z+u

Her iki yaklaşım da bir ilk aşama yürütür (Z'de D). IV standart bir OLS kullanır (D bir kukla olsa bile) Heckman bir probit kullanır. Ancak bunun yanı sıra, temel fark, bu ilk aşamayı ana denkleme kullanma yolundadır:

  • IV : D' nin D: Y = β + β 1'in tahmini ile verilen , ile ilgisi olmayan parçalara ayrıştırılmasıyla endojenliği kırın.εY=β+β1D^+ε
  • Y=β+β1D+β2[λ(D^)-λ(-D^)]+ελ()

β2

Böylece, normal hatalarla kontrol fonksiyonunun (özellikle burada gösterilen iki adım yerine MLE kullanıyorsa) IV'den daha verimli olacağı standart bir hikayeniz var, ancak varsayım tutmazsa IV daha iyi. Araştırmacılar normallik varsayımı konusunda daha şüpheli hale geldikçe IV daha sık kullanılmaktadır.


0

Heckman, Urzua ve Vytlacil'den (2006):

Seçim yanlılığına örnek : Bir politikanın bir ülkenin (örneğin GSYİH) sonuçları üzerindeki etkilerini göz önünde bulundurun. Politikanın yokluğunda bile ölçülemez olarak iyi iş yapacak ülkeler politikayı benimseyen ülkeler ise, OLS tahminleri önyargılıdır.

Bu sorunu çözmek için iki ana yaklaşım benimsenmiştir: (a) seçim modelleri ve (b) enstrümantal değişken modeller.

Seçim yaklaşımı, koşullu ortalamaların modellerini modeller. IV yaklaşımı, koşullu araçların eğimlerini modeller. IV, seçim modellerinde tahmin edilen sabitleri tanımlamaz.

IV yaklaşımı D'yi (tedavi) şartlandırmaz. Seçim (kontrol fonksiyonu) tahmincisi, kontrol fonksiyonlarını kullanarak koşullu araçları tanımlar.

Eğrilik varsayımları olan kontrol fonksiyonlarını kullanırken, bir hariç tutma kısıtlaması gerekmez ( gerektirmez)ZX) seçim modelinde. Hata terimlerinin dağıtımı için fonksiyonel bir form varsa, sonuç denkleminin koşullu ortalamasının koşullu kontrol fonksiyonuna eşit olması olasılığını ortadan kaldırır ve böylece hariç tutma kısıtlamaları olmadan seçim için düzeltme yapabilirsiniz. Ayrıca bkz. Heckman ve Navarro (2004).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.