Ekonometri: Regresyon benim veya herhangi bir gerilememde anlamlı mı?


13

Birkaç ay önce bu organizasyonda staj yaptım; ve uzak bir hediye olarak, öğretmenimin maaşlarını etkileyen faktörleri araştırmak için geçen haftamı ne zamanım olursa olsun harcamaya karar verdim. Öğretmen maaşlarında karşılaştığım sorunlardan biri, verilen devletin dağılımının çarpık olmasıydı. Ücret spektrumunun alt ucuna yapışan birçok gözlemim vardı. Bağımlı değişkenime (öğretmen ücretleri) Karşılaştırılabilir bir Ücret Endeksi ekleyerek bunu çözmeyi denedim, ancak bulduğum sonuçlar projemin kapsamı için tamamen güncel değildi. Bunun yerine bağımlı değişkenimi kaydetmeye karar verdim. Bu güzeldi çünkü ücretlerimin dağılımı normaldi ve histogramda mükemmel görünüyordu. Teste başladığımda son bir bağımsız değişken olan emlak vergisi getirisi ile kaldığım noktaya geldim. Normatif ücretlerimdeki sorun, emlak vergisi beyannamesi gözlemlerinde de açıkça görülüyordu. Spektrumun alt ucuna doğru büyük bir emlak vergisi beyannamesi sayım vardı. Bu değişkeni de kaydettim ve yine de sıfır hipotez testini geçti.

Bunun tam olarak doğru olup olmadığından emin değilim, ancak bir günlüğe kaydedilen değişkenin başka bir günlüğe kaydedilen değişkenle karşılaştırılması bana esneklik verdi. Bunun doğru olduğunu varsayarsak, regresyon denklemim (LogWages = B0 + B1 (LogPropertyTaxReturns) gibi bir şey) iki değişken arasındaki esnekliği gösterir. Bu anlamlı mı? Amacım, eyaletimin herhangi bir ilçesinde hangi değişkenin en çok öğretmen maaşını etkilediğini görmekse, iki değişken arasındaki esnekliği göstermek yardımcı olur mu? En düşük öğretmen maaşlarıyla ilçeleri yaşam standartlarını yükseltmek için yükseltmek istiyoruz, ancak sonuçtaki regresyon denklemimin anlamsız olduğu gerçek gözlemlerden çok uzakta tahmin ettiğimden korkuyorum.

Edit: Benim daha büyük korkularım ben ilişkiyi göstermek için doğrusal olmayan bir model kullanmış olması gerektiğidir. Hem bağımlı hem de bağımsız değişkeni bu lineer regresyonda işbirliği yapmaya zorlamanın bir şekilde yanıltıcı olduğunu hissediyorum.


1
Kesinlikle anlamlı. Esnekliğin tanımına bakın. Temel olarak, Ücretler ve PropertyTaxReturns arasındaki ilişkinin yönü hakkında bilgi sahibi olursunuz. Dahası, bu ilişkinin tahmini bir ölçüsüne sahipsiniz. Log-Log olduğu için ücretler, emlak vergisi beyannamesindeki yüzde bir değişiklik başına B1 yüzde oranında değişecektir. Bunu doğrulamak için bir zaman serisi analizi yapabilirsiniz. Aslında, zaman içinde sadece ücretlerin ve emlak vergisi getirisinin grafiklendirilmesi ilişkinin ne olduğunu görmek için yeterli olacaktır. Bu, gizli değişkenleri vb. Hesaba katmayan temel bir yoldur
Koba

@Koba Çok hızlı yorum yaptığınız için teşekkürler. Bu esneklik eğri boyunca değişse de sorun değil mi? En büyük pişmanlığım, modeli doğrusal olmaya zorlamış olabilirim, bu da esnekliği oldukça kararlı olmaya zorlayabilirdi. Geriye dönüp baktığımda, bahsettiğim bu eğriliği yansıtmak için doğrusal olmayan bir modele sahip olmak daha iyi olabilirdi.
rosenjcb

Değişkenleri log, karekök, karşılıklı veya diğer yöntemler kullanarak dönüştürmede yanlış bir şey yoktur. Hiçbir şey zorlamıyorsunuz. Dönüşümleri, değişkenler arasındaki doğrusal ilişkiyi bulmak için kullanırsınız. Bazen y = b0 + b1 * x kullanmanız kolay olur. Diğer zamanlarda değişkenler doğrusal olarak daha karmaşık bir şekilde ilişkilidir, örneğin log (y) = b0 + b1 * (1 / x). Son işlev size iyi bir doğrusal ilişki verebilir, ancak yorumlanması daha zordur, bu nedenle daha az dönüşüm daha iyi kullanabilirsiniz.
Koba

Log-log fonksiyonu oldukça basit log (y) = b0 + b1 * log (x). B1, enine kesit analizinizdeki yüzde x'lik değişiklik başına yüzde y'deki değişimdir. Yine, belirli bir süre için bu verilere sahipseniz, ilişkiyi görmek için grafik yapabilirsiniz.
Koba

Daha önce değişkenler kaydettim ve regresyon modellerim için başka dönüşümler yaptım. Sadece esnekliğin bir toplantı gibi davrandığından endişelendim. Gerçi, model doğrusal olsa da, sadece çarpık dağılımlarla bağımlı ve bağımsız değişkenlere sahip olma sorunu vardı.
rosenjcb

Yanıtlar:


12

Sorunun cevabı evet, gerçekten anlamlı (en azından matematiksel olarak). Doğrusal denklemi tahmin ederseniz

W=β0+β1PTR,

daha sonra , yani marjinal bir değişikliği temsil üzerinde . Şimdi, tahmin ederseniz β1PTRWβ1=WPTRβ1PTRW

log(W)=β0+β1log(PTR),

daha sonra elastisite çok tanımıdır.β1=WPTRPTRW

Genel olarak konuşursak, doğrusal dönüşümler sadece katsayılara verilen yorumu etkiler, ancak regresyonun kendisinin geçerliliği (geniş ekonomik terimlerle) modelin varsayımları ve analiz edilen ekonomik olgular tarafından verilir.


8

İnsanların yorumlarda söylediği gibi, log-log yaygın olarak kullanılmaktadır. Ekonomi içinde yaygın olarak kullanılan fonksiyonel bir form olan sabit bir elastikiyet modeli tahmin edilmesi anlamına gelir. Günlükleri aldıktan sonra, . Bununla ilgili daha fazla bilgiyi buradan edinebilirsiniz . ln Y = ln α + β ln XY=αXβlnY=lnα+βlnX

Sanırım sorunuz, bu fonksiyonel formun kendi modelinizde mantıklı olup olmadığıdır. Söylemesi zor. Herhangi bir sıradan doğrusal regresyonda olduğu gibi, fonksiyonel form hakkında bir varsayım yaparsınız. En azından log-log dönüşümünden sonra daha anlamlı olan doğrusal bir yaklaşım olarak düşünebilirsiniz.


7

Pekala, diğer katılımcılar bir log-log regresyonunun arkasındaki mantığı oldukça iyi bir şekilde ele aldılar, bu yüzden sadece bazı pratik ipuçları ekleyeceğim. Spesifikasyonunuzun makul olup olmadığını kontrol etmek istiyorsanız ve sorununuz sürekli bir esneklik varsayımı ise, örneği yüzdelik dilimlerine göre gruplara ayırmayı ve ve yeniden hesaplamayı deneyin . Sonra ne kadar farklı olduklarına bakın. Bunu, yüzdelik dilimlerin her biri için kuklalar ve etkileşim terimleri kullanarak yapabilir ve ardından etkileşim terimlerinin ortak önemini belirlemek için bir testi kullanabilirsiniz . Başka bir deyişle: neredeα β F günlüğü y i = α + β günlüğü x i + S j = 2 γ j χ j + λ j χ j günlüğü x i χ j γ λxαβF

logyi=α+βlogxi+j=2Sγjχj+λjχjlogxi
χjsenin yüzdelik kuklaın. Daha sonra ve 'nın birlikte anlamlı olup olmadığını test edin . Bu hiçbir şekilde resmi değildir , ancak sabit bir esnekliğe sahip olmanın ne kadar makul olduğu hakkında kaba bir fikir verebilir.γλ

"Gerçek" temel kararın temsili olarak doğrusal bir gerilemeyle sonuçlanan tüm dönüşümlerin yanlış olduğunu unutmayın. Aslında, tüm modeller yanlış olacak. Soru gerçekten: Bu modelden aldığınız istatistik, probleminiz için yararlı mı? Çalışmanız altta yatan bir modeli belirlemeye odaklanıyorsa, bu size daha derin model hakkında ilginç bir şey anlatan bir an mı? Daha politika odaklıysanız, sürekli esnekliğe sahip bir yaklaşım sizi daha fazla iyileştirmenin alakasız olduğu gerçeğine yeterince yaklaştıracak mı? Her ikisi de dış gözlemci olarak cevaplanması son derece zor sorulardır. Ancak endişeleneceğiniz tek alternatif değişken esneklikse, yukarıda özetlediğim test türü size biraz huzur verebilir.


4

Diğer cevaplar ana konuları ele aldı, ben OP tarafından soruya yapılan "Düzenle" yanıt vermek istiyorum:

Edit: Benim daha büyük korkularım ben ilişkiyi göstermek için doğrusal olmayan bir model kullanmış olması gerektiğidir. Hem bağımlı hem de bağımsız değişkeni bu lineer regresyonda işbirliği yapmaya zorlamanın bir şekilde yanıltıcı olduğunu hissediyorum.

"Bir değişkeni dönüştürmenin" , davranışı "orijinal" olandan tamamen farklı olabilecek yeni bir değişkene yol açtığını unutmaya eğilimliyiz . En kolay örnek, bir değişkenin karesini ve karesini karşılaştırmaktır.

Yani değişkenlerin doğal logaritma dikkate alarak, artık incelemek aralarındaki ilişkiyi ancak bir arasındaki ilişkiyi bazı bunlardan fonksiyonu.
Öyle talihli "logaritmanın" matematiksel kavram biz görüş ekonomik açıdan anlaşılması şey olduğunu yüzde değişimleri arasında bir ilişki açıklanır "elastisite", kavramına bağlantılı olabilir ve biz anlamlı yorumlamak ve kullanmak anlamına.

Değişkenlerin "logaritmalarda doğrusal bir ilişki" sergilediği makul olarak söylenebilirse, düzeylerinin (yani gerçek değişkenler) doğrusal olmayan bir ilişki olduğu anlamına gelir:

lnya+blnxyea+xb

Öyleyse neden doğrusal olmayan bir modeli tahmin etmiyorsunuz?
(Matematiksel) prensipte, bunun olmamasının bir nedeni yoktur. Bazı pratik konular:

1) Doğrusal olmayan ilişkilerin çok fazla biçimi vardır, yalnızca bir doğrusal ilişki vardır (yapısal olarak konuşulur). En uygun şartname için "arama maliyetleri" meselesidir.

2) Elde edilen doğrusal olmayan ilişkinin açık bir ekonomik açıklaması olmayabilir . Bu neden bir problem? Çünkü burada, zaman ve mekanda değişmeyen "doğa yasalarını" ortaya çıkarmıyoruz. Toplumsal bir olguya yaklaşıyoruz. Üstelik, bunu doğrulayan ve destekleyen ekonomik bir akıl olmaksızın , sadece matematiksel bir formül olarak sunulabilecek bir yaklaşıma sahip olmak , sonucu çok ince yapar.

3) Doğrusal olmayan tahmin , tahmin algoritmasının mekaniği ile ilgili olarak daha az kararlıdır.


3

" Hedefiniz, eyaletimin herhangi bir ilçesinde hangi değişkenin öğretmen maaşlarını en çok etkilediğini görmekse " bu durumda modelinizin anlamlı görünmediğini söyleyebilirim . Az önce ücretler (günlükler) ile emlak vergisi beyannameleri arasındaki korelasyonun ne olduğunu gösterdiniz. En azından çoklu regresyon kullanmalısınız.

Elbette, her nedensel etkinin yoğunluğunu tahmin etmek ve en büyüğü bulmak için uygun metodolojik araçlarla tam teşekküllü, uygun bir kimlik stratejisi geliştirmeye devam edebilirsiniz ... Gerçekte, büyük olasılıkla böyle bir görevin karmaşıklığı göz önüne alındığında. Bu sadece ayrıntılandırmaların bir sürekliliğidir ve ücretleri açıklamak için kullanılan en kabaca modele yakınsınızdır, hedefinizde örtük olan soruya verilen bir cevabın kabul edilebilir tahminlerini düşünmekten çok uzaktaysınız. Bir ekonometrinin yardımına başvurmaya çalışmalısınız.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.