“Endogeneity” ve “exogeneity” ne anlama geliyor?


43

İçselliğin temel tanımının, tatmin edici olmadığı, ancak bunun gerçek dünya anlamında ne anlama geldiğini anlıyorum. Vikipedi makalesini arz ve talep örneğiyle okuyup anlamaya çalışarak okudum, ancak gerçekten yardımcı olmadı. Diğer içsel ve dışlayıcı açıklamanın sistem içinde ve sistemin dışında olduğu ve bana mantıklı gelmediğini duydum.

X'ε=0

1
Aşağıdaki üç cevap da çok iyi (her biri için +1). : Eğer başka bir bilgi kaynağı istiyorsanız, burada bu konuyu tartışmak tahmin b1x1+b2x2 yerine b1x1+b2x2+b3x3 , & w / bir simülasyon bunu göstermektedir R.
gung - Monica

1
İçselliğiniz olduğunda, regresyonunuz artık kullanılabilir tahmin edicilere veya test istatistiklerine sahip değildir.
Ivan,

1
@Gung ile aynı fikirdeyim ve tam bir cevabın " Hangi amaç için kullanılabilir" olduğunu vurgulamak isterim ? Yukarıdaki cevapların çoğu bu soruyu çok iyi ele almaktadır.
Matthew Drury

@Matthew Bana öyle geliyor ki, bu soru "gerçek dünya anlamında ne anlama geliyor?" Sorusuna cevap vermeye çalışıyor. Açıklamanın, insanların daha iyi anlayabilmesi için açık kaldığını görmek güzel olurdu.
whuber

@whuber Bilmiyorum, çok kısa, gerçekten söyleyemem. Ancak, örneğin, tahmin edilen modelin endojenliğe sahip olsanız bile tahmin (veya sadece ilişkilendirme) için faydalı olabileceğini düşünüyordum, bu nedenle "artık kullanılabilir tahmin ediciler yok" açıklığa kavuşturulmadan yanlış görünüyor.
Matthew Drury

Yanıtlar:


69

JohnRos'un cevabı çok iyi. Sade İngilizce'de endojenite, nedenin yanlış olduğu anlamına gelir. Yazdığınız ve tahmin ettiğiniz modelin nedensellik gerçek dünyada nasıl yürüdüğünü tam olarak yakalamaması. Yazarken:

Yben=β0+β1Xben+εben

Bu denklemi çeşitli şekillerde düşünebilirsiniz. Bunu , X'in değerlerine dayalı tahmin etmenin uygun bir yolu olarak düşünebilirsiniz . Bunu modellemenin uygun bir yolu olarak düşünebilirsiniz E { Y | X }YXE{Y|X} . Her iki durumda da, endojenlik diye bir şey yoktur ve bunun için endişelenmenize gerek yoktur.

Bununla birlikte, denklemi içgüdüsel nedensellik olarak da düşünebilirsiniz. şu soruya cevap olarak düşünebilirsiniz : " Bu sisteme girersem ve X'i deneysel olarak 1'e çıkarsam Y'ye ne olur ?" Bu şekilde düşünmek istiyorsanız, OLS'yi tahmin etmek için kullanmak, aşağıdakileri varsaymakla ilgilidir:β1YX

  1. , Y'ye neden olurXY
  2. Y'ye neden olurεY
  3. neden değil XεX
  4. , X'e neden olmazYX
  5. Neden hiçbir şey da neden XεX

3-5'ten herhangi birinin başarısız olması, genellikle oldukça eşit veya, Cı- o v ( X , ε ) 0 . Enstrümantal değişkenler nedenseyi yanlış yaptığınızı (başka, farklı, nedensel bir varsayım yaparak) düzeltmenin bir yoludur. Mükemmel bir şekilde yürütülen randomize, kontrollü bir deneme, 3-5'i doğru olmaya zorlamanın bir yoludur . Eğer seçerseniz X rastgele, o zaman emin neden olmadığı Y , £ değerininE{ε|X}0CÖv(X,ε)0XYεveya başka bir şey. "Doğal deney" olarak adlandırılan yöntemler, 3-5'in genellikle doğru olmadığını düşündüğümüzde bile, 3-5'in gerçek olduğu dünyada özel koşullar bulma girişimleridir.

JohnRos'un örneğinde, eğitimin ücret değerini hesaplamak için nedensel bir yorumuna ihtiyacınız vardır, ancak 3 veya 5'in yanlış olduğuna inanmak için iyi nedenler vardır.β1

Bununla birlikte, kafanız karışır. Doğrusal modeldeki derslerde, öğretim elemanının yukarıda verdiğim nedensel yorumunu kullanması çok tipiktir , "hepsi sadece istatistik" gibi davranarak nedensellik getirmiyormuş gibi davranarak. Bu korkakça bir yalan, ama aynı zamanda çok yaygın. β1

Aslında, biyotıp ve sosyal bilimlerde daha büyük bir fenomenin bir parçasıdır. Hemen hemen her zaman, Y üzerindeki nedensel etkisini belirlemeye çalışıyoruz.XY - sonuçta bilim budur. Öte yandan, hemen hemen her zaman, her birinin olduğu gibi 3-5'in birinin yanlış olduğu sonucuna götürecek bazı hikayeler vardır. Bu yüzden, sadece ortak bir çalışma yaptığımızı ve ardından nedensel yorumlamayı başka bir yere gizlice soktuğumuzu söyleyerek (normal olarak makalenin giriş ve sonuç bölümlerinde) bir tür uygulamalı, akıcı, eşdeğer sahtekârlık söz konusu.

Gerçekten ilgileniyorsanız, okuyacak kişi Judea Perl'dir. James Heckman da iyidir.


5
+1 Harika bir açıklama ve yorum. Sitemize hoşgeldiniz!.
whuber

2
Bu konuda temel ve sağlam bir anlayış kazanmak için Heckman’ın hangi çalışmasını önerdiğinizi söyleyebilir misiniz?
Kenny LJ

Bir sorum var: olup olmadığını kontrol etmek nasıl [ ϵ | X ] = 0 veya E [ ϵ X ] = 0 doğrudur “deneyden, yani gözlemsel veri kümesinden elde edilemeyebilecek verilerinizi elde (alan bilginiz yerine) kullanmak doğru mu? E test etmenin bir yolu olmadığını hissediyorum [ ϵ | X ] = 0 veya E [ ϵ X ] = 0 sadece veri kullanır, çünkü observ gözlenebilir değil, o zaman endojenliğin veri kullanılarak test edilemediği doğru mu?E[ϵ|X]=0E[ϵX]=0E[ϵ|X]=0E[ϵX]=0ε
KevinKim

1
@KevinKim Evet. istatistik kullanılarak test edilemez. ε tahminde yapıyor ve daha sonra artıklar yaparak haricinde tahmin / geri alınamaz. Kurtarma ancak bir tahminden sonra yapılabilir. Kurtarma ancak tahmin doğru yapıldığında doğrudur. Tahmin ancak E { ϵ | X } = 0 . Yani, dairesel. Bilgi E { ϵ | X } = 0 , temel, istatistiksel olmayan bir bilgiden gelmelidir. Bunun bir örneği CE{ϵ|X}=0ϵE{ϵ|X}=0E{ϵ|X}=0 burada e , OLS artıklarıdır. Bu, E { ϵ | X } = 0 . Cov{X,e}=0eE{ε|X}=0
Bill

2
@KevinKim Bu doğru. Ve bu sadece doğrusal model değil. Hepsi istatistik. Birisi dediğinde Bildirimi, bunlar hiç bilmen devam asla "korelasyon nedensellik değil" olduğu nedensellik. Nedensellik teoridir ve sadece teori olabilir. Bir (mükemmel --- ve böylece asla yapılmaz) RCT bile teori olmadan nedensellik söylemez.
Bill

18

Bir örnek kullanmama izin ver:

Eğitimin gelir üzerindeki (nedensel) etkisini ölçmek istediğinizi varsayalım. Eğitim yıllarını ve gelir verilerini alır ve birini diğerine karşı gerilersin İstediğini kurtardın mı? Muhtemelen değil! Bunun nedeni gelirin eğitim dışındaki şeylerden de kaynaklandığı, ancak eğitimle ilişkili olduğu. Onlara "beceri" diyelim: Eğitim yıllarının “beceri” den etkilendiğini güvenle söyleyebiliriz, ne kadar yetenekli olursanız, eğitim almak o kadar kolay olur. Bu nedenle, eğitim yıllarını gelire gerilerseniz, eğitim etkisinin tahmincisi “becerinin” etkisini emer ve eğitime dönüşün aşırı iyimser bir tahminini alırsınız. Yani, eğitimin gelir üzerindeki etkisi (yukarı doğru) önyargılıdır; çünkü eğitim gelire eksojen değildir.

Endojenlik sadece nedensel etkileri (sadece korelasyonların aksine) kurtarmak istiyorsanız sorun teşkil eder . Ayrıca bir deney tasarlayabilirseniz, rastgele atama ile olduğunu garanti edebilirsiniz . Ne yazık ki, sosyal bilimlerde bu genellikle mümkün değildir.Cov(X,ϵ)=0


1
Örnek ve açıklama için teşekkürler. Ben hala İngilizce'de dışsallık ve dışsallığın ne anlama geldiği konusunda biraz ipucum yok. Tam olarak ne demek istediğim, bir değişkenin endojen veya ekojen olduğu için.
kullanıcı25901,

@ JohnRos “Endojenlik sadece nedensel etkilerden kurtulmak istiyorsanız bir sorun” yazmışsınız, o zaman şunu söylemek mümkün de olsa: “dışsallık nedensellik anlamına gelir” ... Bu cümleyi asla okumam ... ancak doğru mu? Eğer doğruysa, öyle görünüyor ki, çoğu ders kitabı, bazen dolaylı olarak, nedensel çıkarımı normal hedefler olarak kabul ediyor.
markowitz

@ markowitz: Ne zaman regresyon katsayılarına değindiğiniz zaman, nedensellik istediğiniz anlamına gelir. Yalnızca tahminler istiyorsanız, tahminlerin iyi olması koşuluyla katsayıların değeri gerçekten önemli değil. Klasik ders kitaplarının bu ayrımı yapamadığı doğrudur çünkü tahmin etmeden önce "temel bilim" değil, daha çok "mühendislik" (ve bu kaba genelleme için beni bağışlayın)
JohnRos

Teşekkürler JohnRos, ilgili bir konu hakkında başka bir soru sorayım. Öngörülen katsayıların tahmin edilmesi sorunu sadece nedensellik regresyon modelinde anlam ifade ederken öngörme hedefleri kesin değildir. Bu doğru? Bunu soruyorum çünkü bu nokta hiçbir yerde net değil.
markowitz

8

Kullanıcı25901, ekzojen ve endojen terimlerinin ne anlama geldiği konusunda basit, basit, gerçek dünyaya ait bir açıklama arıyor. Gizli örneklerle veya matematiksel tanımlarla yanıt vermek, sorulan soruyu gerçekten yanıtlamaz.

Bu iki terimi nasıl anlayabiliyorum?

İşte geldiğim şey:

Exo - dış, dış Endo - iç, iç - dış kaynaklı

Ekzojen: Bir değişken, modeldeki diğer parametreler ve değişkenler tarafından belirlenmezse, dışsal olarak ayarlanmış ve herhangi bir değişiklik dış kuvvetlerden geldiğinde modele ekzojendir.

Endojen: Bir değişken, bir modeldeki diğer parametrelerin ve değişkenlerin en azından kısmen bir fonksiyonu olması durumunda modelde endojendir.


7
Bunlar makul sezgisel tanımlar, ancak diğer cevapları bu kadar küçümsemeye gerek yok.
gung - Reinstate Monica

3
Etimolojiye cazip gelmek, teknik terimlerin ne anlama geldiğini (benim için iyi işe yarıyor) hatırlamak için kullanışlı bir kulp verebilir , ancak bunları haklı çıkarmak için etimolojiyi kullanmaktan kaçınılması gerekir. Oldukça az sayıda terim (istatistiklerde ve başka yerlerde) sadece matematiksel tanımlarını dikkatlice inceleyerek anlaşılır. Bu cevabı anlamak, "harici kuvvetler" ve "kısmen [a] işlevi" olarak değiştirilen "hiçbiri hemen olmayan" "dış kuvvetler" ve "kısmen [a] işlevi" gibi sözcüklerin ve cümlelerin kullanım amaçlarının açık bir şekilde anlaşılmasını gerektirir. belirgin veya belirgin.
whuber

6

OLS regresyon, inşaat tarafından verir . Aslında bu doğru değil. O verir X ' ε = 0 inşaat tarafından. Tahmini bakiyeleriniz regresörlerinizle ilgisiz, ancak tahminde bulunduğunuz bakiyeler bir anlamda "yanlış". X'ε=0X'ε^=0

Gerçek veri üretme prosesi ile çalışır durumunda ve Z ile ilişkilidir , X , o zaman X ' , n o ı s eY=α+βX+γZ+nÖbenseZX bir regresyon bırakarak uygun olmadığını Z . Tabii ki, tahmini artıklar X ile ilişkilendirilmez . Her zaman öyledirler, o log ile aynıdır ( e x ) = xX'nÖbense0ZXgünlük(ex)=x. Bu sadece matematiksel bir gerçektir. Bu atlanan değişken önyargıdır.

Söyle rastgele atanır. Belki de insanların doğdukları haftanın günüdür. Belki de gerçek bir deneydir. Y ile ilgili olmayan herhangi bir şeybenY öngörür . Daha sonra rastlantısallığını kullanabilirsiniz I tahmin etmek X'i ve daha sonra tahmin kullanmak X için bir model sığdırmak için Y . XbenXXY

Bu, IV ile neredeyse aynı olan iki aşamalı en küçük karelerdir.


Anladığım kadarıyla 2SLS IV yapmanın bir yolu değil, yanılıyorsam özür dilerim.
kullanıcı25901,

2SLS standart hataları yanlıştır. Neden veya nasıl olduğunu unuttum, ancak "IV 2SLS standart hatalarını" google'da görürseniz büyük olasılıkla bir şeyler bulacaksınız. Çoğu yazılım paketi, çözme (t (z)% *% (x)% *% t (z)% *% y yöntemiyle
2sls uygular

1
Son aşamada (diyelim giriş çünkü 2SLS standart hatalar yanlış X ) gerçek varyansını yansıtmamaktadır X . Düzeltilmiş SE'ler bunun için ayarlanmış. X^X
MichaelChirico

Teşekkürler. Bunu yazdığımda uygulamalı ekonometrikten yeni çıktım.
generic_user

-1

Regresyonda, bağımsız bir değişkenin (dışsal olduğunu ve kendisinin başka bir şeye bağımlı olmadığını varsayıyoruz) tanımlanmış bir bağımlı değişken üzerindeki nicel etkisini yakalamak istiyoruz. Harici bir değişkenin bağımlı değişken üzerindeki net etkisinin ne olduğunu bilmek istiyoruz - yani bağımsız değişken başka bir değişkenden etkilenmemelidir. Regresyonun endojenlik probleminden muzdarip olup olmadığını görmenin hızlı bir yolu, bağımsız değişken ile artıklar arasındaki ilişkiyi kontrol etmektir. Ancak bu sadece kaba bir kontroldür, aksi takdirde endojenliğin resmi testlerinin yapılması gerekir.


3
Bu doğru değil. Artıklar ve bir regresyondan açıklayıcı değişkenler arasındaki korelasyon, yapı olarak sıfırdır. Bu endojenite için bir test değildir.
Andy

E[εX]=0εy=b0+b1x+εεE[e^ben|x]=0e^benartıktır. EğerE[e^ben|x]=0b^0+b^1x
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.