Sadece doğrusal regresyonda doğrusallık varsayımı bir tanım mı


10

Doğrusal regresyonu gözden geçiriyorum.

Greene'nin ders kitabı şöyle diyor:

resim açıklamasını buraya girin resim açıklamasını buraya girin

Şimdi, elbette, doğrusal regresyon modeli üzerinde gibi başka varsayımlar olacaktır E(ϵ|X)=0. Bu varsayım (aslında tanımlayan ϵ) doğrusallık varsayımı ile birleştiğinde , yapıyı modelin üzerine yerleştirir.

Bununla birlikte, doğrusallık varsayımı tek başına modelimize herhangi bir yapı , çünkü ϵϵ tamamen keyfi olabilir. Herhangi değişkenler için X,y olursa olsun, ne olursa olsun ikisi arasında ilişki biz tanımlayabilir ϵ doğrusallık varsayımı tutar, öyle ki. Bu nedenle, doğrusallık "varsayım" gerçekten çağrılmalıdır tanımı içinde ϵ yerine bir varsayım.

Bu yüzden merak ediyorum :

  1. Greene özensiz mi? Aslında şunu yazmış olmalı: ? Bu, aslında yapıya model koyan bir "doğrusallık varsayımı" dır.E(y|X)=Xβ

  2. Yoksa doğrusallık varsayımı modeline yapıyı koymak olmadığını kabul etmek zorunda ama sadece bir tanımlamaktadır do diğer varsayımlar arasında bu tanımı kullanacağız, £ değerinin modeline yapıyı koymak için?ϵϵ


Düzenleme : diğer varsayımlar etrafında bazı karışıklık var gibi görünüyor, bana burada varsayımların tam set eklemek:

resim açıklamasını buraya girin

Bu Greene, Ekonometrik Analiz, 7. baskı. s. 16.


4
Bunlar algısal gözlemlerdir (+1). Bununla birlikte, tüm adaletlerde, yazarların çoğunun (hepsi olmasa da), ϵ gibi bir ilave hatanın anlamının , dağılımının 0 merkezli olduğu varsayımını içerdiği bir çerçeve içinde çalıştığına inanıyorum . ϵ0
whuber

2
@whuber, tüm varsayımları ekledim. A3'e bakın. A3, 0'da ortalandığını açıkça belirtiyor, bu da Greene'nin A1'de bunu kabul etmediğini ima ediyor, bu da A1'in tanımlaması dışında herhangi bir mantıksal içeriğe sahip olup olmadığını sorgulamamı sağlıyor . ϵ
user56834

2
Varsayımlar listesinin amaçlanan anlamı, ayrı ayrı değil toplu olarak tutulmasıdır . Bu herhangi bir "özensizlik" sergilemez.
whuber

2
@AdamO, "doğru" kelimesinin benim için kesin bir anlamı yok gibi görünüyor. Bunu daha iyi anlamaya çalışıyorum. Yalnızca şu anda moest kesin formülasyon bu varsayım 1 "tanımı çağrılmalıdır demek ki geliyor bana " ve sonra her şey mantıklı. Ya da aslında bir şey eksik, bu yüzden bu soruyu sordum. Ne yazık ki şu ana kadar bu soruya doğrudan bir cevap görmedimϵ
user56834

2
@ Programmer2134, kesin olmayan bir soru sorduğunuz için kesin olmayan cevaplar alıyorsunuz. Söylediğiniz gibi “yapıya bir model koymaz”. Yanlış ortalama model ( ) kullanılırsa, yanıt Y = f ( x ) + sapma + hatası olarak karakterize edilir . ve artıklar yanlılık ve hatanın toplamı olarak alınır. f(x)Y=f(x)+bias+error
AdamO

Yanıtlar:


8
  1. Greene özensiz mi? Aslında şunu yazmış olmalı: ? Bu, aslında yapıya model koyan bir "doğrusallık varsayımı" dır.E(y|X)=Xβ

Bir anlamda, evet ve hayır. Bir yandan, evet, mevcut modern nedensellik araştırması göz önüne alındığında , özensizdir, ancak tıpkı çoğu ekonometri ders kitabı gibi, nedensel ve gözlemsel miktarları net bir şekilde ayırmadığı için, bu soru gibi ortak kafa karışıklıklarına yol açarlar. Ancak, diğer yandan, hayır, bu varsayım, aslında varsaymaktan farklı olduğu anlamında özensiz değildir .E(y|X)=Xβ

Burada önemli nokta, bir koşullu beklenti arasındaki fark, , ve yapısal ve (nedensel) denklemi y , hem de yapısal (nedensel) bir beklenti E [ Y | d o ( X ) ]E(y|X)yE[Y|do(X)] . Greene'deki doğrusallık varsayımı yapısal bir varsayımdır. Basit bir örnek görelim. Yapısal denklemi düşünün:

y=βx+γx2+ϵ

Şimdi . Sonra:E[ϵ|x]=δxγx2

E[y|x]=βx

burada . Dahası, y = β x + ϵ yazabiliriz ve E'ye sahip olurduk [ ϵ | x ] = 0 . Bu, doğru bir şekilde belirlenmiş doğrusal koşullu beklentimiz olabileceğini göstermektedir E [ y | x ] tanım gereği dikey bir rahatsızlığa sahip olacak, ancak yapısal denklem doğrusal olmayacaktır.β=β+δy=βx+ϵE[ϵ|x]=0E[y|x]

  1. Yoksa doğrusallık varsayımı modeline yapıyı koymak olmadığını kabul etmek zorunda ama sadece bir tanımlamaktadır do diğer varsayımlar arasında bu tanımı kullanacağız, £ değerinin modeline yapıyı koymak için?ϵϵ

Doğrusallık varsayımı bir tanımlar , yani ϵ : = y - X β = y - E [ Y | d o ( X ) ] tanım gereği, ϵ , deneysel olarak X'i ayarladığımızda y'nin beklentisinden sapmalarını temsil eder ( bkz. İnci bölüm 5.4 ). Diğer varsayımlar ya yapısal parametrelerin tanımlanması için kullanılır (örneğin, ϵ eksojenitesi varsayımı.ϵϵ:=yXβ=yE[Y|do(X)]ϵy Xϵyapısal beklentiyi belirlemenizi sağlar koşullu beklenti ile E [ Y | X ] ) veya tahmin edicilerin istatistiksel özelliklerinin türetilmesi için (örneğin, homoskedastisite varsayımı OLS'yi MAVİ olarak garanti eder, normallik varsayımı, çıkarım için "sonlu örnek" sonuçları elde etmeyi kolaylaştırır).E[Y|do(X)]E[Y|X]

Bununla birlikte, doğrusallık varsayımı tek başına modelimize herhangi bir yapı , çünkü ϵ tamamen keyfi olabilir. Herhangi değişkenler için X , Y olursa olsun, ne olursa olsun ikisi arasında ilişki biz tanımlayabilir £ değenni doğrusallık varsayımı tutar, öyle ki.ϵX,yϵ

Buradaki ifadeniz genel olarak nedensel çıkarımın ana sorununa giriyor! Yukarıdaki basit örnekte gösterildiği gibi, koşullu beklenti yapabilir yapısal bozuklukları uydurmak verilen x doğrusal. Genel olarak, birkaç farklı yapısal (nedensel) model aynı gözlemsel dağılıma sahip olabilir , gözlemlenen ilişki olmadan nedensel olabilirsiniz. Bu nedenle, bu anlamda, biz daha fazla varsayımlara ihtiyaç --- doğru £ değerinin problem haline "daha yapıya" koymak ve yapısal parametreler tespit etmek amacıyla P gözlemsel verilerle.yxϵβ

Kenar notu

Çoğu ekonometri ders kitabının, regresyon ve yapısal denklemler ve anlamları arasındaki ayrım söz konusu olduğunda kafa karıştırıcı olduğunu belirtmek gerekir. Bu son zamanlarda belgelendi. Sen bir kağıt kontrol edebilirsiniz Chen ve Pearl burada yanı sıra Chris Auld tarafından genişletilmiş anket . Greene incelenen kitaplardan biridir.


Teşekkürler, aradığım cevap bu. Öyleyse, doğrusallık varsayımının yapısal bir varsayım olduğunu söylediğinizde, bu tam olarak ve x arasındaki nedensel ilişki hakkında ne gerektirir ? Hala doğru bir nedensel ilişki olabilir mi? Sadece x ile y arasındaki doğrudan nedensel ilişkinin doğrusal olması değil mi? Hala yüksek dereceden doğrusal olmayan nedensel etkisi olabilir x üzerinde y ile £ değerinin ? ϵxxyxy ϵ
user56834

1
Programmer2134 @ bu ekonometrisi ders kitapları özensiz bir alan denklem yapısal ise, o zaman farkı olarak yapısal bozukluğu işlevsel bir tanımı olabilir, vb doğrudan küçük referans / dolaylı etkileri, arabuluculuk bulacaksınız var beklenen ile X'in nedensel etkisi , yani ϵ : = y - E [ Y | d O ( X ) ] = Y - X, β . Dolayısıyla bu anlamda yapısal ϵ , X tarafından "neden olunmaz " . Ancak, bu bizeyXϵ:=yE[Y|do(X)]=yXβϵX ve X ilişkisi , çünkü ortak nedenleri olabilir. ϵX
Carlos Cinelli

@ Programmer2134 Bu arada, endişeleriniz doğru yolda, bence nedensel çıkarım konusunda Pearl's Primer Greene'nin ilginç bir arkadaşı olabilir!
Carlos Cinelli

Bu arada, Pearl tarafından bir süre önce "Nedensellik: Modeller, Akıl Yürütme ve Çıkarım" okumaya başladım. Çok ilginç olduğunu düşündüm, ama benim için biraz soyuttu. Bölüm 2'nin ötesine geçmedim. Sizce "nedensel çıkarım üzerine primer" daha uygun olur mu? (yani kavramları daha sezgisel olarak tanıtmak).
user56834

1
@ColorStatistics, tahmin için regresyon kullanabilirsiniz, ancak, sonra dışsallık varsayımı hiçbir rol oynamaz. Bu, Greene'nin neden doğrusal olduğu varsayımını neden yazmadığını sorgulayarak OP'nin kendisinden şüphelenmeye başladı . E(Y|x)
Carlos Cinelli

0

OP ve Matthew Drury tarafından yapılan yorumların ardından düzenlenmiştir

Bu soruyu cevaplamak için Greene ve OP'nin aşağıdaki doğrusallık tanımına sahip olduğunu varsayıyorum: Doğrusallık, bu öngörücüdeki her bir birim artış için sonucun, olası öngörücü değerleri aralığında nerede olursa olsun beta ( ) tarafından artırıldığı anlamına gelir. bu bir birimlik artış meydana gelir. Yani fonksiyon y = f ( x ) olan y = a + b X ve değildir , örneğin y = a + b x 2 ya da Y = bir + s i n ( x )βy=f(x)y=a+bxy=a+bx2y=a+sin(x). Ayrıca, bu varsayım betalara odaklanmıştır ve bu nedenle yordayıcılar (diğer bir deyişle bağımsız değişkenler) için geçerlidir.

modeline bağlı kalıntıların beklentisi başka bir şeydir. Evet, doğrusal regresyonun arkasındaki matematiğin E ( ϵ | X ) = 0'ı tanımladığı / tanımladığı doğrudur . Bununla birlikte, bu genellikle y için takılmış / tahmin edilen tüm değerler aralığında ayarlanır . Eğer doğrusal öngörücü ve tahmin edilen değerin belirli bölümlerine bakarsak y , fark edebilirsiniz heteroskedastisiyi (varyasyon alanları £ değerinin başka bir yerde daha büyüktür) veya alanlar nerede E ( £ | X )E(ϵ|X)E(ϵ|X)=0yyϵ . Bununnedeni x 'ler ve y arasında doğrusal olmayan bir ilişkiolabilir, ancak heteroscedastisite veya E ( ϵ | X ) 0 olmasının tek nedeni bu değildir(bkz. Örneğin eksik tahminci yanlılığı).E(ϵ|X)0xyE(ϵ|X)0

Yorumlardan: OP, epsilonun keyfi olduğu ve XX'nin herhangi bir işlevi olabileceği göz önüne alındığında, doğrusallık varsayımının modeli hiçbir şekilde kısıtlamadığını belirtir. Sanırım bu, doğrusallık varsayımının ihlal edilip edilmediğine bakılmaksızın, herhangi bir veriye uyabilecek doğrusal regresyonların netleştiğini düşünüyorum. Burada spekülasyon yapıyorum, ancak Greene'nin formülünde hatayı tutmayı seçmesinin nedeni olabilir - daha sonra E ( ϵ | X ) = 0'ı kaydetme - doğrusallığı varsayarsak, y (ve beklenen değil) y ) X'e göre tanımlanabilir, ancak bazı hataları korur ϵϵE(ϵ|X)=0yyXϵvalues ​​hangi değerleri alsın. Sadece daha sonra E ( ϵ | X ) = 0 alaka düzeyini belirtmeye devam edeceğini umuyorum .ϵE(ϵ|X)=0

Kısacası (kuşkusuz, Greene'nin kitabını tam olarak okumadan ve tartışmasını kontrol etmeden):

  1. Greene muhtemelen betaların tüm prediktör aralığı için sabit olduğunu ifade eder (beta'ya veya E ( ϵ | X ) = X β denklemlerinde vurgu yapılmalıdır ;y=Xβ+ϵE(ϵ|X)=Xβ
  2. Doğrusallık varsayımı modele bazı yapılar koymaktadır. Bununla birlikte, modellemeden önce spline gibi dönüşümlerin veya eklemelerin, lineer olmayan ilişkilerin lineer regresyon çerçevesine uygun hale gelebileceğini unutmayın.

3
Bu yardımcı olur, ancak hiçbir şekilde sürekliliğe itiraz gerekmez. sadece ( 0 , 1 ) öngörücülere dayanıyorsa, makine aynı şekilde çalışır . X(0,1)
Nick Cox

1
f(y)f(x)

@NickCox Bu noktaları düzenledim.
IWS

1
X

3
Buna katılmıyorum. Beklenti varsayımı normalite ile ilgisi yoktur, ancak yapısal doğrusallık varsayımını anlamlandırmak için kesinlikle gereklidir. Aksi takdirde, op tarafından belirtildiği gibi, doğrusallık varsayımı anlamsızdır. Bir normallik varsayımı oldukça farklı bir canavardır ve genellikle gereksizdir.
Matthew Drury

-1

Yukarıdaki cevaptan biraz kafam karışmıştı, bu yüzden başka bir şans vereceğim. Bence soru aslında 'klasik' doğrusal regresyon değil, o kaynağın tarzı ile ilgili. Klasik regresyon kısmında:

Bununla birlikte, doğrusallık varsayımı tek başına modelimize herhangi bir yapı koymaz

ϵX

E(y|X)=Xβ

İlk soruyu cevaplamak istemiyorum ama olağan doğrusal regresyon için ihtiyacınız olan varsayımları özetleyeyim:

xiRdyiRi=1,...,n(xi,yi)(Xi,Yi)

  1. iβRdYi=βXi+ϵiiϵi

  2. ϵiϵiN(0,σ)σi

  3. X=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y

Artık her zamanki yolu çalıştırabilir ve hesaplayabilirsiniz

fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd)nexp(i=1n(yiβxi)22σ)

logfY|X(y|x)β

ϵ

Şimdi farklı olasılıklar var:

  • Bu varsayımı kitapta yazmaz. O zaman bu kitapta bir hatadır.

  • +ϵϵ

    • O alıntı yaptığınız kısma yakından yazar ve siz / biz sadece fark etmediniz (ayrıca bir olasılık :-))

fY|Xϵ


3
OLS'yi kullanmak için hataların normal olarak dağıtılması gerekmez.
user56834

(-1) Hataların normal olarak dağıtılması gerekmez. Aslında, parametre tahmininin tarafsız olması ve testlerin tutarlı olması için bağımsız veya özdeş dağıtılmış olmalarına gerek yoktur. OLS'nin kesin bir test olması için çok daha katı spesifikasyonlarınız gereklidir.
AdamO

ϵi

1
@FabianWerner benim model seçimim sorulacak soruya bağlı. Doğrusal regresyon, bir veri kümesindeki birinci dereceden bir eğilimi, X'deki bir farkı Y'deki bir farkla ilişkilendiren bir "temel kural" olarak tahmin eder. Hatalar normal olarak dağıtılmazsa, Lindeberg Feller CLT, CI'lerin ve PI'lerin yaklaşık olarak doğru olduğunu garanti eder. çok küçük örneklerde bile. Hatalar bağımsız değilse (ve bağımlılık yapısı bilinmiyorsa), SE'ler yanlış olsa da tahminler önyargılı değildir. Sandviç hata tahmini bu sorunu hafifletir.
AdamO
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.