Aynı şeyin farklı disiplinlerde farklı isimler olarak adlandırıldığı bazı terminolojik farklılıklar vardır:
- Biyoistatistikteki uzunlamasına veriler aynı bireylerin tekrarlanan gözlemleridir = ekonometride panel verileri.
- 1 olasılığının olarak modellendiği bir ikili bağımlı değişken için model, ekonometride bir logit modeli ve biyoistatistiğin lojistik modeli olarak adlandırılır. Biyoistatistikçi onların olarak, oran oranları açısından lojistik regresyon ile çalışmak eğilimindedir ler genellikle ikili, bu nedenle olasılık oranları popülasyonda iki grup halinde ilgilenilen sonuç göreli frekansları temsil eder. Bu, bu yorumu kolaylaştırmak için sık sık iki kategoriye dönüştürülen sürekli bir değişkeni göreceğiniz ortak bir yorumdur.x1/(1+exp[−x′β])x
- İstatistikçilerin “denklemleri tahmin etme” ekonometrisyenlerin “an şartları” dır. İstatistikçilerin tahminleri ekonometristlerin ekstremum tahmin edicileridir.M
Aynı terimin farklı disiplinlerde farklı şeyler ifade etmek için kullanıldığı terminolojik farklılıklar vardır:
- Sabit etkiler , ANOVA istatistikçilerinin regresyon denklemindeki ve ekonometristler için "içsel" bir tahminci anlamına gelir.x′β
- Sağlam çıkarım, ekonomistler için heteroskedastisite düzeltmeli standart hatalar (kümelenmiş standart hatalara ve / veya otokorelasyon düzeltmeli standart hatalara yönelik uzantılarla) ve istatistikçilere çok fazla aykırı davranan yöntemler anlamına gelir.
- Ekonomistlerin, tabakalı örneklerin seçim olasılıklarının gözlemler arasında değiştiği durumlar olduğu saçma bir fikre sahip görünüyor. Bunlara eşit olmayan olasılık örnekleri denir. Tabakalı numuneler, örneklemeden önce bilinen özelliklere göre popülasyonun önceden tanımlanmış gruplara ayrıldığı numunelerdir.
- Ekonometrisyenlerin “veri madenciliği” (en azından 1980'lerin literatüründe) Harrell'in kitabında harika bir şekilde anlatılmış olan birçok test ve tuzaklar anlamına geliyordu . Bilgisayar bilimcilerinin (ve istatistikçilerinin) veri madenciliği prosedürleri, veride kalıp bulmada parametrik olmayan, istatistiksel öğrenme olarak da bilinen yöntemdir .
Ekonometriğin eşsiz katkılarını
- Mpiktas'ın başka bir cevapta açıkladığı gibi, endojenite ve kötü tanımlanmış regresyon modelleri ile başa çıkma yolları , (i) açıklayıcı değişkenlerin kendilerinin rasgele olabileceğini (ve dolayısıyla parametre tahminlerinde önyargı üreten regresyon hatalarıyla ilişkili), (ii) modeller ihmal edilen değişkenlerden muzdarip olabilir (bu, daha sonra hata teriminin bir parçası olur), (iii) ekonomik ajanların uyaranlara nasıl tepki verdiğinin gözlemlenmemiş bir heterojenliği olabilir, bu nedenle standart regresyon modellerini karmaşıklaştırır. Angrist & Pischke bu konuların harika bir incelemesi ve istatistikçiler ondan regresyon analizinin nasıl yapılacağı hakkında çok şey öğrenecekler. En azından istatistikçiler enstrümantal değişkenler regresyonunu öğrenmeli ve anlamalıdır.
- Daha genel olarak, ekonomistler, bulgularının çok değişkenli normallik kadar saçma bir şeye dayanmadığından emin olmak için modelleri hakkında mümkün olduğunca az varsayım yapmak istiyorlar. Bu nedenle GMM ekonomistler arasında oldukça popülerdir ve hiçbir zaman istatistiklere kapılmamıştır ( 1960'ların sonlarında Ferguson tarafından minimum olarak tanımlanmış olmasına rağmen ). Bu yüzden ampirik olasılığın benimsenmesi, ekonometride katlanarak artmıştır, ancak istatistiklerde marjinaldir. Ekonomistlerin regresyonlarını "sağlam" standart hatalarla ve istatistikçilerle, varsayılan OLS standart hatalarıyla çalıştırmasının nedeni budur .s 2 ( X ′ X ) - 1χ2s2(X′X)−1
- Zaman aralığında düzenli aralıklarla işlerin yapıldığı birçok iş var - makroekonomik veriler böyle toplanıyor. Eşsiz katkılar, entegre ve bütünleşik süreçleri ve otoregresif koşullu heteroskedasticity ((G) ARCH) yöntemlerini içerir. Genel olarak mikro bir insan olduğum için bunlara daha az aşina oluyorum.
Genel olarak, ekonomistler, modellerinde katsayıların güçlü yorumunu aramaya meyillidirler. İstatistikçiler, çoğu zaman basit bir tahmin aracı olarak, olumlu sonuç olasılığını elde etmenin bir yolu olarak lojistik bir model alırlar ve ayrıca GLM'nin sahip olduğu hoş üstel aile özelliklerine sahip yorumunu ve ayrıca ayrımcı analizle bağlantılarını not edebilirler. Ekonomistler, logit modelinin faydalı yorumunu düşünür ve bu modelde sadece tanımlanmasından ve heteroskedasticity'nin onu atabileceğinden endişe ederler . (İstatistikçiler ne olduğunu merak ediyor olacaklarσβ/σσ Elbette, ekonomistler bundan bahsediyorlar.) Elbette, girdilerinde doğrusal olan bir yardımcı program Mikroekonomik 101 perspektifinden çok komik bir şey, her ne kadar yarı-içbükey işlevlerde genellemeler muhtemelen Mas-Collel'de yapılsa da.
Ekonomistlerin genel olarak neyi kaçırdığı, ancak IMHO'nun fayda sağlayacağı şey, çok değişkenli analizin birçoğudur (ölçüm değişkenleriyle başa çıkmanın bir yolu olarak gizli değişken modeller de dahil olmak üzere gizli değişken modelleri dahil) , regresyon teşhisi (tüm bu Cook mesafeleri, Mallows 'Cp, DFBETA, vb.), Eksik verilerin analizi (Manski'nin kısmi kimliği kesinlikle fantezidir, ancak ana MCAR / MAR / NMAR çöküşü ve çoklu değerlendirme daha faydalıdır) ve anket istatistikleri. Yaygın istatistiklerden pek çok başka katkı ekonometri tarafından eğlendirildi ve standart bir metodoloji olarak kabul edildi veya kısa vadeli bir moda olarak kabul edildi: 1960'ların ARMA modelleri ekonometride muhtemelen yüksek lisans programları olarak biliniyor. istatistiklerde bu günlerde bir zaman serisi kursu sunmakta başarısız olabilir; 1970'lerin büzülme tahmin edicileri / sırt regresyonu gelişti ve gitti; ekonomistlerin önyükleme sınırlamalarının daha iyi farkında olmaları gerekmesine rağmen, 1980'lerin önyüklemesi herhangi bir karmaşık durum için bir diz gerginliği tepkisidir; 1990'ların ampirik olasılığı, teorik ekonomistlerden teorik istatistikçilerden daha fazla metodoloji gelişimi gördü; 2000'lerin hesaplamalı Bayesian yöntemleri ekonometride eğlendiriliyor, ancak benim hissim, daha önce bahsettiğim sağlamlık paradigmasıyla uyumlu olamayacak kadar parametrik, fazla model tabanlı. Ekonomistlerin, modern istatistiklerde aşırı derecede sıcak olan istatistiksel öğrenme / biyoinformatik veya mekansal-zamansal şeylerden herhangi birini kullanıp kullanmayacakları açık bir çağrıdır.