Ekonometri ve diğer istatistiksel alanlar arasındaki ana felsefi, metodolojik ve terminolojik farklar nelerdir?


70

Ekonometri, geleneksel istatistiklerle önemli ölçüde örtüşmektedir, ancak genellikle çeşitli konular hakkında kendi jargonunu kullanır ("tanımlama", "dışlayıcı" vb.). Bir keresinde başka bir alandaki uygulamalı istatistik profesörünün terminolojinin farklı olduğunu fakat kavramların aynı olduğunu yorumladığını duydum. Yine de kendine has yöntemleri ve felsefi ayrımları var (Heckman'ın ünlü makalesi akla geliyor).

Ekonometri ve ana akım istatistikler arasında hangi terminoloji farklılıkları vardır ve alanlar terminolojiden daha farklı olarak nerelerde farklılaşır?

Yanıtlar:


96

Aynı şeyin farklı disiplinlerde farklı isimler olarak adlandırıldığı bazı terminolojik farklılıklar vardır:

  1. Biyoistatistikteki uzunlamasına veriler aynı bireylerin tekrarlanan gözlemleridir = ekonometride panel verileri.
  2. 1 olasılığının olarak modellendiği bir ikili bağımlı değişken için model, ekonometride bir logit modeli ve biyoistatistiğin lojistik modeli olarak adlandırılır. Biyoistatistikçi onların olarak, oran oranları açısından lojistik regresyon ile çalışmak eğilimindedir ler genellikle ikili, bu nedenle olasılık oranları popülasyonda iki grup halinde ilgilenilen sonuç göreli frekansları temsil eder. Bu, bu yorumu kolaylaştırmak için sık sık iki kategoriye dönüştürülen sürekli bir değişkeni göreceğiniz ortak bir yorumdur.x1/(1+exp[xβ])x
  3. İstatistikçilerin “denklemleri tahmin etme” ekonometrisyenlerin “an şartları” dır. İstatistikçilerin tahminleri ekonometristlerin ekstremum tahmin edicileridir.M

Aynı terimin farklı disiplinlerde farklı şeyler ifade etmek için kullanıldığı terminolojik farklılıklar vardır:

  1. Sabit etkiler , ANOVA istatistikçilerinin regresyon denklemindeki ve ekonometristler için "içsel" bir tahminci anlamına gelir.xβ
  2. Sağlam çıkarım, ekonomistler için heteroskedastisite düzeltmeli standart hatalar (kümelenmiş standart hatalara ve / veya otokorelasyon düzeltmeli standart hatalara yönelik uzantılarla) ve istatistikçilere çok fazla aykırı davranan yöntemler anlamına gelir.
  3. Ekonomistlerin, tabakalı örneklerin seçim olasılıklarının gözlemler arasında değiştiği durumlar olduğu saçma bir fikre sahip görünüyor. Bunlara eşit olmayan olasılık örnekleri denir. Tabakalı numuneler, örneklemeden önce bilinen özelliklere göre popülasyonun önceden tanımlanmış gruplara ayrıldığı numunelerdir.
  4. Ekonometrisyenlerin “veri madenciliği” (en azından 1980'lerin literatüründe) Harrell'in kitabında harika bir şekilde anlatılmış olan birçok test ve tuzaklar anlamına geliyordu . Bilgisayar bilimcilerinin (ve istatistikçilerinin) veri madenciliği prosedürleri, veride kalıp bulmada parametrik olmayan, istatistiksel öğrenme olarak da bilinen yöntemdir .

Ekonometriğin eşsiz katkılarını

  1. Mpiktas'ın başka bir cevapta açıkladığı gibi, endojenite ve kötü tanımlanmış regresyon modelleri ile başa çıkma yolları , (i) açıklayıcı değişkenlerin kendilerinin rasgele olabileceğini (ve dolayısıyla parametre tahminlerinde önyargı üreten regresyon hatalarıyla ilişkili), (ii) modeller ihmal edilen değişkenlerden muzdarip olabilir (bu, daha sonra hata teriminin bir parçası olur), (iii) ekonomik ajanların uyaranlara nasıl tepki verdiğinin gözlemlenmemiş bir heterojenliği olabilir, bu nedenle standart regresyon modellerini karmaşıklaştırır. Angrist & Pischke bu konuların harika bir incelemesi ve istatistikçiler ondan regresyon analizinin nasıl yapılacağı hakkında çok şey öğrenecekler. En azından istatistikçiler enstrümantal değişkenler regresyonunu öğrenmeli ve anlamalıdır.
  2. Daha genel olarak, ekonomistler, bulgularının çok değişkenli normallik kadar saçma bir şeye dayanmadığından emin olmak için modelleri hakkında mümkün olduğunca az varsayım yapmak istiyorlar. Bu nedenle GMM ekonomistler arasında oldukça popülerdir ve hiçbir zaman istatistiklere kapılmamıştır ( 1960'ların sonlarında Ferguson tarafından minimum olarak tanımlanmış olmasına rağmen ). Bu yüzden ampirik olasılığın benimsenmesi, ekonometride katlanarak artmıştır, ancak istatistiklerde marjinaldir. Ekonomistlerin regresyonlarını "sağlam" standart hatalarla ve istatistikçilerle, varsayılan OLS standart hatalarıyla çalıştırmasının nedeni budur .s 2 ( X X ) - 1χ2s2(XX)1
  3. Zaman aralığında düzenli aralıklarla işlerin yapıldığı birçok iş var - makroekonomik veriler böyle toplanıyor. Eşsiz katkılar, entegre ve bütünleşik süreçleri ve otoregresif koşullu heteroskedasticity ((G) ARCH) yöntemlerini içerir. Genel olarak mikro bir insan olduğum için bunlara daha az aşina oluyorum.

Genel olarak, ekonomistler, modellerinde katsayıların güçlü yorumunu aramaya meyillidirler. İstatistikçiler, çoğu zaman basit bir tahmin aracı olarak, olumlu sonuç olasılığını elde etmenin bir yolu olarak lojistik bir model alırlar ve ayrıca GLM'nin sahip olduğu hoş üstel aile özelliklerine sahip yorumunu ve ayrıca ayrımcı analizle bağlantılarını not edebilirler. Ekonomistler, logit modelinin faydalı yorumunu düşünür ve bu modelde sadece tanımlanmasından ve heteroskedasticity'nin onu atabileceğinden endişe ederler . (İstatistikçiler ne olduğunu merak ediyor olacaklarσβ/σσ Elbette, ekonomistler bundan bahsediyorlar.) Elbette, girdilerinde doğrusal olan bir yardımcı program Mikroekonomik 101 perspektifinden çok komik bir şey, her ne kadar yarı-içbükey işlevlerde genellemeler muhtemelen Mas-Collel'de yapılsa da.

Ekonomistlerin genel olarak neyi kaçırdığı, ancak IMHO'nun fayda sağlayacağı şey, çok değişkenli analizin birçoğudur (ölçüm değişkenleriyle başa çıkmanın bir yolu olarak gizli değişken modeller de dahil olmak üzere gizli değişken modelleri dahil) , regresyon teşhisi (tüm bu Cook mesafeleri, Mallows 'Cp, DFBETA, vb.), Eksik verilerin analizi (Manski'nin kısmi kimliği kesinlikle fantezidir, ancak ana MCAR / MAR / NMAR çöküşü ve çoklu değerlendirme daha faydalıdır) ve anket istatistikleri. Yaygın istatistiklerden pek çok başka katkı ekonometri tarafından eğlendirildi ve standart bir metodoloji olarak kabul edildi veya kısa vadeli bir moda olarak kabul edildi: 1960'ların ARMA modelleri ekonometride muhtemelen yüksek lisans programları olarak biliniyor. istatistiklerde bu günlerde bir zaman serisi kursu sunmakta başarısız olabilir; 1970'lerin büzülme tahmin edicileri / sırt regresyonu gelişti ve gitti; ekonomistlerin önyükleme sınırlamalarının daha iyi farkında olmaları gerekmesine rağmen, 1980'lerin önyüklemesi herhangi bir karmaşık durum için bir diz gerginliği tepkisidir; 1990'ların ampirik olasılığı, teorik ekonomistlerden teorik istatistikçilerden daha fazla metodoloji gelişimi gördü; 2000'lerin hesaplamalı Bayesian yöntemleri ekonometride eğlendiriliyor, ancak benim hissim, daha önce bahsettiğim sağlamlık paradigmasıyla uyumlu olamayacak kadar parametrik, fazla model tabanlı. Ekonomistlerin, modern istatistiklerde aşırı derecede sıcak olan istatistiksel öğrenme / biyoinformatik veya mekansal-zamansal şeylerden herhangi birini kullanıp kullanmayacakları açık bir çağrıdır.


14
+1 Bu, farklı bir topluluğa bir soru açıldığında ne gibi harika cevapların ortaya çıkabileceğinin mükemmel bir örneğidir .
whuber

1
@whuber, yorumunuz için teşekkürler. Disiplin ayrımları açıkçası beni delirtiyor.
StasK

@StasK Mükemmel cevap. Bir hızlı nokta olsa da. “Genel olarak, ekonomistler, modellerinde katsayıların güçlü yorumunu aramaya meyillidirler.” Açıkçası, bu biraz yanlıştır çünkü VAR analizinde (ki bu çok popülerdir, bu nedenle ifadeniz "genel" olarak söylenmemelidir) merkez noktası, modelin katsayılarını yorumlamak yerine dürtü yanıt fonksiyonlarını yorumlamakta , yorumlamaya çalışmak için çok karmaşıklar).
Graeme Walsh,

@GraemeWalsh - Gördüğüm gibi, makro / zaman serilerinde çalışmıyorum. Bunu gösterdiğin için teşekkürler.
StasK

20

Ekonometriğin ana aracı olduğundan doğrusal regresyon ile açıklamak en iyisidir. Doğrusal regresyonda bir modelimiz var:

Y=Xβ+ε

Diğer istatistiksel alanlar ve ekonometri arasındaki temel fark, diğer alanlarda sabit olarak muamele görmesi ve ekonometride rasgele değişken olarak ele alınmasıdır. Bu farkı ayarlamak için kullanmanız gereken ekstra özen, farklı jargonlar ve farklı yöntemler üretir. Genelde, ekonometride kullanılan tüm yöntemlerin açıklayıcı değişkenlerin rastlantısallığı için ayarlanan diğer istatistik alanlarındaki yöntemlerle aynı olduğunu söyleyebilirsiniz. Kayda değer istisna, benzersiz bir ekonometrik araç olan GMM'dir .X

Farklılığa bakmanın bir başka yolu, diğer istatistik alanlarındaki verilerin bir kimlik örneği olarak kabul edilebileceğidir. Ekonometride, çoğu durumda veriler, yalnızca özel bir durum olan stokastik süreçten bir örnektir. Dolayısıyla yine farklı jargon.

Yukarıdakileri bilmek, genellikle diğer istatistik alanlarından ekonometriye atlamak için yeterlidir. Genellikle model verildiğinden, ne olduğunu anlamak zor değildir. Bana göre, makine öğrenimi ile klasik istatistikler arasındaki jargon farkı, ekonometri ve klasik istatistikler arasında olduğundan çok daha büyük.

Ekonometri olmadan istatistikte anlam ifade eden terimler olduğunu unutmayın. Asıl örnek, sabit ve rastgele etkiler. Bu terimlerle ilgili Wikipedia makaleleri ekonometriği istatistiklerle karıştıran bir karmaşadır.


5
"En önemli örnek sabit ve rastgele etkiler. Bu terimler hakkında Wikipedia makaleleri karışıklık yaratıyor, ekonometrileri istatistiklerle karıştırıyor." Çok doğru.
Michael Bishop

8

İnce bir fark, ekonomistlerin bazen modellerde hata terimlerine anlam atfetmeleridir. Bu, özellikle ilgiyi veya bireysel heterojenliği temsil eden yapısal parametreleri tahmin edebileceğinizi düşündüğünüz “yapısal” ekonomistler arasında geçerlidir.

Bunun bir sınıf örneği probit. İstatistikçiler genel olarak hata terimine neyin sebep olduğu konusunda haksızlık yaparken, ekonomistler sık ​​sık regresyonlardaki hata terimlerini tercihlerin heterojenliğini temsil eden olarak görürler. Probit vakası için, bir kadının işgücüne katılma kararını modelleyebilirsiniz. Bu, çeşitli değişkenler tarafından belirlenecektir, ancak hata terimi, iş için bireysel tercihlerin değişebileceği gözlemlenmemiş bir dereceyi temsil edecektir.


4
İstatistikçiler hata terimine neyin sebep olduğu konusunda agnostik olabilirken, bu onların umurunda olmadığı anlamına gelmez. Tarif ettiğiniz, hata teriminin heterojenliğidir; bu, hatalarla ilgili olağan varsayımların karşılanmadığı anlamına gelir. Hiçbir istatistikçi bunu görmezden gelmez.
mpiktas

2
İlginç bir şekilde, bu durumda, hata terimi biçiminde bir sorun yoktur. İstatistikçiler ve ekonomistler aynı şekilde silahlanacaklar ve heteroskedasticity veya diğer herhangi bir kimliği olmayan hata terimleri konusunda endişeleneceklerdir. Bununla birlikte, hata terimi bir probitte olduğu gibi N (0,1) olsa bile, ekonomistler ekonomik bir yorum yapmaya elverişlidir.
d_a_c321

5
Bu genel olarak modelleme için geçerlidir. Modeli kendi özel yönteminizle yorumlamak benim tecrübelerime göre ekonomistler ile sınırlı değil.
mpiktas

Katılmıyorum. Ekonomistler açıkça <sadece şaka!> Modellerinin akıllıca yorumlanmasında tekele sahipler. Yine de iyi nokta.
d_a_c321

8

Elbette, herhangi bir geniş ifadenin aşırı geniş olması şarttır. Ancak benim deneyimim, ekonometrinin nedensel ilişkiler konusunda endişe duyduğu ve istatistiklerin tahminle daha fazla ilgilendiği oldu.

Ekonomi tarafında, "güvenilirlik devrimi" literatüründen ( Çoğunlukla Zararsız Ekonometri vb.) Kaçınamazsınız . Ekonomistler, politika değerlendirmesine ve tavsiyelerine yönelik olarak, bazı tedavilerin bazı sonuçlar üzerindeki etkisine odaklanmaktadır.

İstatistik tarafında, veri madenciliği / makine öğreniminin çevrimiçi analitik ve genetik uygulamalarına kayda değer örnekler olarak yükselişini görüyorsunuz. Burada araştırmacılar, tam olarak açıklamak yerine davranış veya ilişkileri tahmin etmekle daha fazla ilgileniyorlar; sebeplerden ziyade kalıpları ararlar.

1930'larda tarımsal deneylere geri dönen istatistikçilerin geleneksel olarak deneysel tasarıma daha fazla ilgi duyduklarından da bahsedeceğim.


7

Ana akım istatistik bilim ekonomisti olarak adlandırdığım şeye kıyasla, şematik ya da veri tabanlı grafikleri kullanmak konusunda isteksiz göründüğünü fark ettim. Ekonometride doğal olarak diğer yerlerden daha merkezi olan regresyonun kapsamı, bu noktada önemli bir durumdur. İstatistikçiler tarafından yapılan regresyona yapılan modern tanıtımlar, verilerin çizilmesi ve teşhis grafikleri de dahil olmak üzere, regresyonun sonuçlarının çizilmesinin değeri boyunca vurgu yaparken, ekonometri metinlerinde tedavi açıkça daha resmidir. Ekonometride önde gelen metinler çok fazla grafik içermez ve değerlerini güçlü bir şekilde desteklemez.

Belirsiz ya da daha kötü görünme riski olmadan bunu analiz etmek zordur, ancak aşağıdakilerin bir birleşimini katkıda bulunanlar olarak tahmin ediyorum.

  1. Titizlik arzusu. Ekonometristler, verilerden öğrenme konusunda şüpheli veya düşmanca olma eğilimindedir ve resmi testlere dayanan kararları şiddetle tercih ederler (ne zaman bir teoremden çıkmazlarsa). Bu, "teori" ye dayanan modellerin tercihine bağlıdır (her ne kadar bu sadece bir tahmincinin daha önce bir gazetede verilerden bahsetmeyen bazı iktisatçılar tarafından belirtildiği anlamına gelebilir).

  2. Yayın uygulamaları Ekonomi veya ekonometri dergileri için bildiriler oldukça stilize edilmiş katsayılar tablosu, standart hatalar, t-istatistikleri ve P-değerleri ile ağırdır. Grafik eklemek bile birçok durumda düşünülmemiş gibi görünmektedir ve eğer teklif edilebilirse gözden geçirenler tarafından kesilmek üzere önerilebilir. Bu uygulamalar, nesiller boyu veya daha fazla, otomatik hale geldikleri ölçüde, önem dereceleri üzerinde katı sözleşmeler vb.

  3. Karmaşık modeller için grafikler. Tamamen grafikler, pek çok öngörücü, vb. İle karmaşık bir modele uyan bir grafik varmış gibi görünmediği zaman göz ardı edilir (ki buna karar vermek genellikle zordur).

Doğal olarak, önerdiğim şey, olduğu gibi araçların bir farkıdır ve her iki durumda da çok fazla değişkenlik tanıyorum.


4

Diğer nicel disiplinlerin aksine, ekonomi MARGIN'deki şeylerle ilgilenir. Yani, marjinal fayda, marjinal ikame oranı, vs.dir. Matematik açısından, ekonomi "birinci" (ve daha yüksek mertebeden türevler) ile ilgilenir.

Birçok istatistiksel disiplin, ortalamalar ve varyanslar gibi türev olmayan büyüklüklerle ilgilenir. Elbette, marjinal ve koşullu olasılık dağılımları alanına girebilirsiniz, ancak bu uygulamaların bazıları da ekonomiye giriyor (örneğin, "beklenen değer").


2

Ekonometri değil, bağlamdır. Olasılık fonksiyonunun benzersiz bir optimum özelliği yoksa, hem bir istatistikçiyi hem de ekonometrisini ilgilendirir. Şimdi eğer ekonomik teoriden gelen bir varsayım önerirseniz ve parametrelendirmeyi parametrenin tanımlanması için sınırlandırırsanız, ekonometri olarak adlandırılabilir, ancak varsayım herhangi bir temel alandan gelebilirdi.

Dışsallık felsefi bir konudur. Ekonomistlerin genelde Rubin'in yaptığı gibi anladıkları farklı görüşlerin karşılaştırması için örneğin http://andrewgelman.com/2009/07/disputes_about/ adresine bakın .

Yani, kısacası, ya öğretmeninizin kullandığı jargonu benimseyin ya da açık fikirli olun ve geniş olarak okuyun.


2

Ekonometristler nedensel çıkarımla neredeyse tamamen ilgileniyorlar, istatistikçiler de sonuçları tahmin etmek için modeller kullanıyor. Sonuç olarak, ekonometristler dışsallığa daha fazla odaklanır (diğerlerinin dediği gibi). Azalan form ekonometristler ve yapısal ekonometristler bu nedensel yorumlamalara farklı şekillerde girerler.

Azalan form ekonometrisyenleri enstrümantal değişkenler tekniklerini kullanarak dışsallıkla ilgilenirler (IV ise istatistikçiler tarafından çok daha az kullanılır.)

Yapısal ekonomistler, istatistikçiler tarafından işte nadir görülen bir teoriye dayanarak parametrelerin nedensel yorumlarını alırlar.


1
IV istatistiki olmayan kişilerce bolca kullanılır ve düşük formlu ekonometrikler sadece IV (nedensel farklılık, regresyon süreksizlik vb.) Dışında nedensel çıkarım için birçok teknik kullanır. Bkz Imbens bu kağıt son olmayan ekonometrik istatistiksel IV gelişmelere ekonometri IV bir uzlaşma.
Ari B. Friedman

2

Bir istatistikçi olarak bunu daha genel anlamda düşünüyorum. Biyometri ve ekonometriye sahibiz. Bunlar, istatistiklerin problemleri çözmek için kullanıldığı alanlardır. Biyometri ile biyolojik / tıbbi problemlerle uğraşıyoruz, ekonometrik ekonomi ile ilgileniyor. Aksi halde, farklı disiplinlerin farklı istatistiksel teknikleri vurgulaması dışında aynı olacaktır. Biyometride hayatta kalma analizi ve beklenmedik durum tablosu analizi yoğun olarak kullanılmaktadır. Ekonometri için zaman serileri yoğun olarak kullanılmaktadır. Regresyon analizi her ikisinde de ortaktır. Ekonomi ve biyoistatistik arasındaki terminoloji farklılıklarına dair cevapları gördükten sonra asıl sorunun esas olarak terminoloji ile ilgili olduğu görülüyor ve ben sadece diğer ikisine değindim. Cevaplar o kadar iyi ki buna hiçbir şey ekleyemiyorum. Özellikle StasK'ın cevaplarını beğendim. Ancak bir biyostatist olarak, logit modelini ve lojistik modeli birbirinin yerine kullandığımızı düşünüyorum. Logit dönüşümünü log (p / [1-p]) olarak adlandırıyoruz.


2
(+1) Alan adlarına özgü problemlere, uygulamalı istatistik alan adındaki uygulamalar listesine psikometri ekleyebilirsiniz .
Andy W
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.