OLS tahmincisi türetmek için varsayımlar


14

Birisi benim için kısaca açıklayabilir mi, OLS tahmincisini hesaplamak için altı varsayımın her birine neden ihtiyaç duyulur? Sadece çoklu doğrusallık hakkında buldum - eğer mevcutsa (X'X) matrisini tersine çeviremeyiz ve sonuç olarak genel tahminciyi tahmin edemeyiz. Peki ya diğerleri (örneğin, doğrusallık, sıfır ortalama hatalar, vb.)?



1
Kavramsal bir açıklama mı arıyorsunuz, yoksa matematiksel bir gösteriye mi ihtiyacınız var?
gung - Monica'yı eski

4
Sıradan en küçük kareler sayısal bir prosedürdür, hesaplamak için çok fazla varsayım gerekmez (tersinirlik dışında). Varsayımlar haklı ihtiyaç vardır çıkarım : ona dayalı, benim cevap dün bkz stats.stackexchange.com/questions/148803/...
Halvorsen Kjetil b

1
Tam olarak hangi "altı varsayımdan" bahsediyorsunuz? Sadece üçünden bahsediyorsun.
whuber

1) doğrusallık 2) çoklu bağlantı doğrusallığı olmaması 3) sıfır ortalama hata 4) küresel hatalar (homossedastisite ve otokorelasyon dışı) 5) stokastik olmayan regresörler ve 6) normal dağılım. Aşağıdaki cevaptan da anlaşılacağı gibi, tahmin ediciyi türetmek için sadece ilk üçü gereklidir ve diğerleri sadece tahmin edicinin MAVİ olduğundan emin olmak için mi gereklidir?
Ieva

Yanıtlar:


23

Mükemmel çoklu bağlantıya sahip olduğunuz durum dışında OLS tahmincisini her zaman hesaplayabilirsiniz. Bu durumda, X matrisinizde mükemmel çok doğrusal bağımlılığa sahip olursunuz. Sonuç olarak, tam sıralama varsayımı yerine getirilmez ve tersinirlik sorunları nedeniyle OLS tahmincisini hesaplayamazsınız.

Teknik olarak, OLS tahmincisini hesaplamak için diğer OLS varsayımlarına ihtiyacınız yoktur. Bununla birlikte, Gauss-Markov teoremine göre, tahmincinizin MAVİ olması için OLS varsayımını (clrm varsayımları) yerine getirmeniz gerekir.

Gauss-Markov teoremi ve matematiksel türevinin kapsamlı bir tartışmasını burada bulabilirsiniz:

http://economictheoryblog.com/2015/02/26/markov_theorem/

Ayrıca, OLS varsayımına genel bir bakış, yani kaç tane varsa, neye ihtiyaç duyduklarını ve tek OLS varsayımını ihlal ederseniz ne olacağını burada ayrıntılı bir tartışma bulabilirsiniz:

http://economictheoryblog.com/2015/04/01/ols_assumptions/

Umarım yardımcı olur, şerefe!


14

Aşağıdakiler basit kesitlere dayanmaktadır, zaman serileri ve paneller için biraz farklıdır.

  1. Popülasyonda ve dolayısıyla örnekte, model şu şekilde yazılabilir: Bu bazen yanlış anlaşılan doğrusallık varsayımıdır. Model parametrelerde doğrusal olmalıdır - yani . ile istediğiniz her şeyi yapmakta özgürsünüz . Günlükler, kareler vb. Durum böyle değilse, model OLS tarafından tahmin edilemez - başka bir doğrusal olmayan tahminciye ihtiyacınız vardır.
    Y=β0+β1x1++βkxk+u=Xβ+u
    βkxi
  2. Rastgele bir örnek (kesitler için) Bu, çıkarım ve örnek özellikleri için gereklidir. OLS'un saf mekaniği için bir şekilde önemsizdir.
  3. Mükemmel Eşitsizlik Yok Bu, arasında mükemmel bir ilişki olamayacağı anlamına gelir . Bu, un tekil olmayan olmasını sağlayan varsayımdır , öyle ki var olur.xi(XX)(XX)1
  4. Sıfır koşullu ortalama: . Bu, modeli doğru bir şekilde belirttiğiniz anlamına gelir: atlanan değişkenler yoktur ve tahmin ettiğiniz işlev formu (bilinmeyen) nüfus modeline göre doğrudur. Bu, OLS ile her zaman sorunlu bir varsayımdır, çünkü aslında geçerli olup olmadığını bilmenin bir yolu yoktur.E(u|X)=0
  5. Hatalar teriminin varyansı sabittir, tüm : koşuluna bağlıdır, yine OLS mekaniği için hiçbir şey ifade etmez, ancak normal standart hataların geçerli olmasını sağlar.XiVar(u|X)=σ2
  6. Normallik; u hata terimi bağımsızdır ve . Yine bu, OLS mekaniği ile ilgisizdir, ancak örnekleme dağılımının normal olmasını sağlar , .XiuN(0,σ2)βkβk^N(βk,Var(βk^))

Şimdi çıkarımlar için.

  1. 1-6 altında (klasik doğrusal model varsayımları) OLS, en düşük varyans anlamında en iyi olan MAVİ'dir (en iyi doğrusal tarafsız tahmin edici). Aynı zamanda tüm lineer tahmin ediciler ve x'in bazı fonksiyonlarını kullanan tüm tahmin ediciler arasında etkilidir. Daha da önemlisi 1-6 altında OLS aynı zamanda minimum varyans yansız tahmin edicisidir. Bu, tüm yansız tahmin ediciler arasında (sadece lineer değil) OLS'un en küçük varyansa sahip olduğu anlamına gelir. OLS da tutarlıdır.

  2. 1-5 (Gauss-Markov varsayımları) altında OLS MAVİ ve etkilidir (yukarıda açıklandığı gibi).

  3. 1-4 altında OLS tarafsız ve tutarlıdır.

Aslında OLS, den daha zayıf bir varsayımla da tutarlıdır : ve . Varsayımlardan 4 fark, bu varsayım altında, fonksiyonel ilişkiyi mükemmel bir şekilde çivi çakmaya gerek duymamanızdır.(4)(1) E(u)=0(2) Cov(xj,u)=0


Bence sıfır ortalama durum hakkında çok karanlık bir resim çiziyorsunuz. Bir yanlılık olsaydı, o zaman kare sapmaların toplamını en aza indirmek uygun bir şey olmazdı, ancak diğer taraftan, yanlılığı regresyon denklemini kaydırarak (yanlılığı ) ve sonra Eğer do 4 hem doğrulamak için imkansız ve görmezden kolaydır, başka deyişle ortalama 0 değerini var. β0
user3697176

Üzgünüm ama aynı fikirde değilim. Ya da belki sadece seni yanlış anlıyorum? Ya eloborat yapabilir ya da referans verebilir misiniz?
Repmat

I OP ilgilenen değildi inanıyoruz (örneğin, sırt regresyon gibi) yaklaşık kasıtlı çarpık tahmini, konuşmak değil., Burada Hal bir modeli söz ediyorum olarak ki bu - tuhaf bir nedenden dolayı - artık demek . Bu durumda, dönüşüm yapmak kolaydır , burada ortalaması sıfırdır. y=β0+β1x1++βxxn+ϵϵα0y=α+β0+β1x1++βxxn+ηη
user3697176

@ user3697176 Yazdıklarınız doğru değil. Az önce nedenini açıklamak için bir cevap gönderdim.
Alecos Papadopoulos

Varsayım 1 karşılanmazsa, yine de popülasyon kovaryansını tahmin etmek için OLS'yi kullanamaz mıyız (doğrusal bir ilişki olmadığını bilmemize rağmen)?
en fazla

7

Başka bir sorudaki bir yorum , regresyon belirtimine sabit bir terimin dahil edilmesiyle düzeltilebileceğini savunarak, koşulunun önemi hakkında şüpheler ve " msgstr "kolayca yoksayılsın".E(uX)=0

Bu öyle değil. Regresyona sabit bir terimin dahil edilmesi, eğer bu koşullu ortalamanın regresörlerin bir fonksiyonu değil zaten sabit olduğunu varsayarsak , muhtemelen sıfır terimi olmayan koşullu ortalamayı emer . Bu , sabit bir terim içerip içermediğimizden bağımsız olarak yapılması gereken hayati varsayımdır :

E(uX)=const.

Bu tutarsa, o zaman sıfır olmayan ortalama biz sadece sabit terim dahil ederek çözebilir bir sıkıntı olur.

Ancak bu geçerli değilse (yani koşullu ortalama sıfır veya sıfır olmayan bir sabit değilse ), sabit terimin dahil edilmesi sorunu çözmez: bu durumda "emeceği" bir büyüklüktür bu, spesifik numuneye ve regresörlerin gerçekleşmelerine bağlıdır. Gerçekte, bir dizi serisine eklenmiş bilinmeyen katsayı, hata teriminin sabit olmayan koşullu ortalaması yoluyla regresörlere bağlı olarak gerçekten sabit değil, değişkendir.

Bu ne anlama geliyor? Basitleştirmek için, en basit durumda varsayalım, nerede ( endeksler gözlemler) ama bu . Hata terimi onun eş olanlar dışındaki Regresör gelen ortalama bağımsız olduğunu Yani o (içinde biz do not olanları bir dizi ekleyin).E(uiXi)=0iE(uixi)=h(xi)X

Regresyonu, sabit bir terimin (bir dizi dizinin bir regresörü) dahil edilmesiyle belirlediğimizi varsayalım.

y=a+Xβ+ε

ve sıkıştırma gösterimi

y=Zγ+ε

burada , , , .a=(a,a,a...)Z=[1:X]γ=(a,β)ε=ua

O zaman OLS tahmincisi

γ^=γ+(ZZ)1Zε

İçin sapmasızlık ihtiyacımız . FakatE[εZ]=0

E[εixi]=E[uiaxi]=h(xi)a

sabit bir fonksiyon olmadığında incelendiğimiz için tüm için sıfır olamaz. Yaniih(xi)

E[εZ]0E(γ^)γ

ve

Eğer , o zaman içerse bile, bir sabit terim regresyonda, OLS tahmincisi tarafsız olmayacaktır, yani Gauss-Markov'un verimlilik üzerindeki sonucu kaybolurE(uixi)=h(xi)h(xj)=E(ujxj) .

Ayrıca, error hata terimi her için farklı bir ortalamaya ve dolayısıyla farklı bir varyansa sahiptir (yani şartlı olarak heteroskedastiktir). Dolayısıyla, regresörlere koşullu dağılımı gözlemler arasında farklılık gösterir . εii

Ama hata terimi bile bu araçlar normaldir varsayılır, örnekleme hatası sonra dağıtım normal olacağını ama değil sıfır ortalama in mormal ve bilinmeyen önyargı ile. Ve varyans farklı olacaktır. Yaniuiγ^γ

Eğer , o zaman içerse bile, bir sabit terim regresyonda, Hipotez testi artık geçerli değildir.E(uixi)=h(xi)h(xj)=E(ujxj)

Başka bir deyişle, "sonlu örneklem" özelliklerinin hepsi gitmiştir.

Sadece ek varsayımlar yapmak zorunda kalacağımız asimptotik olarak geçerli çıkarımlara başvurma seçeneğimiz kaldı .

Yani basitçe, Sıkı Dışsallık olamaz "kolayca göz ardı" olmak .


Bunu anladığımdan tam olarak emin değilim. Ortalamanın, homoscedastisite varsayımına eşdeğer regresörlerin bir fonksiyonu olmadığı varsayılmıyor mu?
Batman

@Batman Yazımın hangi kısmına atıfta bulunuyorsunuz?
Alecos Papadopoulos

"Regresyona sabit bir terimin dahil edilmesi, bu koşullu ortalamanın zaten regresörlerin bir fonksiyonu değil sabit olduğunu varsayarsak, hata teriminin sıfırdan farklı koşullu ortalamasını absorbe edecektir. Bu çok önemli bir varsayımdır. sabit bir terim içerip içermediğimizden bağımsız olarak yapılması gerekir. " Koşullu ortalamanın, homoscedastisite varsaydığımızda varsaydığımız şeyin tam olarak regresörlerin bir fonksiyonu olmadığını varsaymıyor muyuz?
Batman

@ Batman Homoskedasticity varyans hakkında bir varsayımdır. Ortalama bağımsızlık varsayımı, de sabit olduğu anlamına gelmez , bu da koşullu homoskedastisite için de gereklidir. Aslında, ortalama bağımsızlık,koşullu heteroskedastisite ile birlikte, standart bir model varyantıdır. E(uj2x)E(ux)=const.E(u2x)=g(x)
Alecos Papadopoulos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.