“Kontrol değişkenleri” de içselse ne olur?


13

Politik İktisatta çalışıyorum ve modellerin birçoğu nüfus, eşitsizlik, sömürge mirası vb. Gibi "masum" kontrol değişkenlerini içeriyor, böylece yazar bağımsız ilgi değişkenleri üzerinde tarafsızlık iddiasında bulunabilir.

Fakat bu kontrol değişkenlerinden herhangi biri atlanan bir değişken için endojen ise, bu TÜM bağımsız değişkenlerin tarafsızlığını kirletmez mi?

Eğer bu doğruysa, ne yapabiliriz? Bu kontrol değişkenlerini dışarıda bırakın ve değişken değişken yanlılığa neden olurlar. Bunları ekleyin ve modeldeki her şeyi kirletecekler.

Örnek: Bir araştırmacı, eşitsizliğin şiddete yol açıp açmadığını bilmek istiyor ve birkaç şeyi kontrol ediyor:

Violence=Inequality+Growth+Development+ϵ
gören eşitsizlik olası nedeniyle çıkarılmıştır değişken bölgesinin (endojen olmaktır fedakarlık Seviye), Eşitsizlik için araçsal bir değişken bulmaya çalışacaktır . Fakat Büyüme ve Gelişmenin endojen olması da (yani özgecilik Düzeyi ile ilişkili) olması muhtemel değil mi?

Bu örnek aptalca görünebilir, ama benim açımdan Politik Ekonomi / Kalkınma çalışmasında, LHS'de yer alan birçok değişkenin endojen olduğundan korkuyorum (henüz atlanmış). Yine de, araştırmacı sadece evcil hayvandan bağımsız değişkeni için bir araç arar.


Dikkate alınması gereken başka bir şey de sözde "kötü kontrol" meselesidir - kontrolün bir sonuç değişkeninin kendisi olduğu bir durum. Bu konuyu ve sorunuzu daha iyi anlamak istiyorsanız neden önemli olduğunu öğrenmek için Angrist ve Pischke'nin ünlü "Çoğunlukla Zararsız Ekonometri" bölümünde Bölüm 3.2.3'ü okumanızı tavsiye ederim.
MauOlivares

Yanıtlar:


10

"Fakat bu kontrol değişkenlerinden herhangi biri atlanan bir değişken için endojen ise, bu TÜM bağımsız değişkenlerin tarafsızlığını kirletmiyor mu?"

Bunu çok fazla vurgulamak istemiyorum, ancak bunun genel olarak doğru olmadığını belirtmek gerekir. Aşağıdaki türetme umarım bahsettiğiniz "kontaminasyon" hakkında biraz bilgi sağlayacaktır. Basit bir karşı örnek olarak, veri üreten işlem ile verildiğini varsayalım Z, gözlemlenmeyen. Let o V ( X 1 , Z ) = 0 , C O v ( x 2

Y=X1β1+X2β2+Zγ+ε,
ZCov(X1,Z)=0 ve C O v ( x 1 , x 2 ) = 0 . Sonra, o kadar açıktır X 2 ise "endojen". Ancak dikkat edin ki C o v ( X 1 , Z ) = 0 olduğundan , β 1 tahminimizhala iyi olacaktır: plimCov(X2,Z)0Cov(X1,X2)=0X2Cov(X1,Z)=0β1 buradaX * 1 =M2x1veM2=[I-X2(X ' 2 x2)-1x ' 2 ]. ÇünküCov(X1,X2)=0,X1
plimβ^1=β1+γCov(X1,Z)Var(X1)=β1,
X1=M2X1M2=[IX2(X2X2)1X2]Cov(X1,X2)=0 . Bu nedenle C o v ( X 1 , Z ) = 0 .X1=X1Cov(X1,Z)=0

"Ne yapabiliriz?"

İyi ekonometri yapmanın başlıca zorluklarından biri potansiyel tanımlama stratejilerini düşünmektir. Tanımladığınız durum türünde, soruna farklı bir şekilde yaklaşmaya çalışmaktan başka yapabileceğiniz bir şey yoktur.


Teknik olarak haklı olmanıza rağmen, bu noktayı vurgulamam. Genel olarak, bazı senaryolarda sorun olmadığını söylemek yerine, değişkenlerin herhangi birinin önyargılılığını ekarte edemeyeceğimizi söyleyebilirim , çünkü genellikle DGP'yi bilmiyoruz.
FooBar

β^Cov(X1,Z)=0Cov(X1,X2)=0Cov(X1,X2)=0Cov(X1,X2)=0X2

@FooBar, katılıyorum. Bunun özel bir durum olduğunu vurgulamak için yayını güncelledim. DGP'yi bilmeme noktasına gelince, bu doğrudur. Ama mesele bu değil. Herhangi bir analiz DGP ile ilgili varsayımlar yapmak zorundadır ve analizin kalitesi varsayımların kalitesine bağlıdır. Verdiğim türetme, sizi gitmek istediğiniz yere götürebilecek varsayımların (yine de çok güçlü varsayımlar) bir örneğini göstermeye hizmet ediyor.
jmbejara

Cov(X1,Z)=0Cov(X1,Z)=0YX1X2

1
@jmbejara 1) ayrı bir soru olarak yayınladım . Bu durumda Google çalışanı için başlığı akıllıca ve kullanışlı bir şekilde nasıl ifade edeceğimi bilmediğim için lütfen sorumu / başlığımı düzenlemekten çekinmeyin.
Heisenberg


5

En küçük kareler kestirimi bağlamında, regresörlerin olası endojenliği ile başa çıkmamız (denememiz) yolu Enstrümantal Değişkenler kestirimidir. Bu yaklaşım, sadece bir endojen regresöre sahip değildir - çok fazla olabilir. Böyle bir durumda, elbette işleri daha da zorlaştıran daha fazla enstrüman bulmanız gerekir - ancak prensipte yöntem aynı şekilde çalışır.

IV tahmini önyargı konusunu çözmez, sadece tahmin ediciye tutarlılık sağlar. Ancak hiçbir şey önyargı barının katı dışsallık sorununu çözmez (ve sonra bazı önyargı azaltma yöntemleri vardır). Ancak , istatistiklerle ilgili başka bir GD sitesi olan Çapraz Doğrulanmış'a bakarsanız , deneyimli istatistikçilerin tarafsızlık özelliğine çok fazla ağırlık vermediklerini göreceksiniz - sonlu örnek özellikler için Ortalama Kare Verimliliğine odaklanırlar, ve büyük numune özellikleri için tutarlılık.


1
Dolayısıyla doğru yaklaşım, tüm endojen değişkenler için araç bulmaktır, değil mi?
Heisenberg

1
Evet, işte böyle.
Alecos Papadopoulos

5

Bu, istatistikçi Andrew Gelman'ın "ara sonucu kontrol etmenin yanlışlığı" olarak adlandırdığı şeyin bir örneğidir . İşte araştırmacılar daha fazla kız çocuğunun siyasetinizi değiştirip değiştirmediğini sorduğunda ortaya çıkan bu yanlışlığın açıklaması. İkinci bir çocuğa sahip olma kararı mutlaka ilk çocuğa sahip olma kararına bağlıdır ve bu nedenle içsel olan karar değişkenini kontrol etmenin açık bir örneği gibi görünmektedir.

Son birkaç yılda, oğullarının ebeveynlerinin, kızlarının ebeveynlerine kıyasla ekonomik kararlarına bakarak çeşitli çalışmalar yapılmıştır ... Tüm bu çalışmaların ortak bir özelliği, toplam çocuk sayısını kontrol etmeleridir ... İlk bakışta, toplam çocuk sayısını kontrol etmek makul görünüyor. Bununla birlikte, toplam çocuk sayısının ara bir sonuç olması ve bunun kontrol edilmesi (verileri #kids'e dayalı olarak alt kümelere ayırarak veya bir regresyon modelinde bir kontrol değişkeni olarak #kids kullanarak) tahmin etmede önyargılı olabilir. bir oğluna (veya kızına) sahip olmanın nedensel etkisinin

Bunu görmek için, (muhafazakar olarak) politik olarak muhafazakar ebeveynlerin oğulları istemesi daha olası olduğunu ve iki kızları varsa, (varsayımsal olarak) üçüncü bir çocuk için deneme olasılıklarının daha yüksek olduğunu varsayalım. Buna karşılık, liberallerin iki kızda durma olasılığı daha yüksektir. Bu durumda, 2 kız çocuğu olan ailelere ilişkin verilere bakarsanız, muhafazakarlar yeterince temsil edilmeyecek ve veriler kızların siyasi liberalizmle bir ilişkisini gösterebilir - kızlarına sahip olmanın hiçbir etkisi olmasa bile! ...

Bir çözüm, standart konservatif (istatistiksel anlamda!) Yaklaşımı nedensel çıkarımda uygulamaktır, bu da tedavi değişkeniniz (çocuk cinsiyeti) üzerinde gerilemektir, ancak sadece çocuk doğmadan önce gerçekleşen şeyleri kontrol eder. Örneğin, ilk çocuğu kız olan ebeveynleri, ilk çocuğu erkek olan ebeveynlerle karşılaştırabiliriz. İkinci çocuğa kız olan ebeveynleri, ikinci çocuğu erkek çocuk olan ebeveynlerle birinci çocuğun cinsiyetini kontrol edenlerle karşılaştırarak ikinci doğuma da bakılabilir. Üçüncü çocuk vb.

Oğul sahibi olmak seni daha muhafazakar yapar mı? Belki, belki değil. Ara sonucu kontrol etmekle ilgili bir sorun

"Bu kontrol değişkenlerini dışarıda bırakın ve değişken sapmanın kendiliğinden çıkmasına neden olan" yorumunuzla ilgili olarak, bu, ne tür bir araç aldığınıza bağlı gibi görünmektedir. Gereksinimleri gerçekten karşılayan iyi bir araç, ikinci aşamadaki hata teriminden bağımsız olmalı ve doğrudan kontrol ettiğiniz diğer her şeyden bağımsız olmalıdır . Yani, araç Y'yi sadece X yoluyla değiştirir. Bu nedenle, eğer şiddet denkleminin şiddetin yapısal denklemi olduğuna inanırsak, eşitsizlik için uygun bir araç büyüme ve gelişmeden bağımsız olmalıdır (bunu bulmakta iyi şanslar!).


1

Diğer direklerin işaret ettiği gibi, endojen regresörler, regresörler ilişkili olduğunda regresyondaki tüm parametre tahminlerini kirletebilir.

X1X2X2X1

β^1X2X1X2

Aşağıdaki modeli düşünün (@ jmbejara gösterimine benzer)

y=X1β1+X2β2+Zγ+ε,

Zε1nx1(k)εp01nx2(k)εp0kX21nx1(k)z(l)p0(k,l)

Şimdi endojen ise , ancak , ve arasındaki tüm korelasyonun için kontrol edildikten sonra kaybolacağı anlamınaX2X1X1ZX2 , yani,

1nx1(k)QX2z(l)p0
tüm , burada , (`` artık yapıcı '') sıfır boşluğuna yansıtmadır , yani o zaman iyiyiz. Bunun nedeni, aşağıdaki iki aşamalı tahmincisinden (örn. Amemiya, 1985, s. 6-7):(k,l)QX2X2QX2[InX2(X2X2)1X2]β1

X1X2

β^1=(X1QX2X1)1X1QX2y=β1+(X1QX2X1)1X1QX2X2p0β2+(X1QX2X1)1X1QX2Zp0γ+(X1QX2X1)1X1QX2εp0
QED. Buradaki üçüncü satır önemlidir ve ve ilişkisiz / dikey olduğunda neden güvende olduğumuzu da gösterir . Mutlu endojen regresyonlar.X1X2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.