Değişkenler değiştiğinde olağan regresyon ve regresyon


13

Değişkenler farklı olduğunda normal çoklu / basit regresyon ile çoklu / basit regresyon arasındaki ilişkinin ne olduğunu anlamaya çalışıyorum.

Örneğin, mevduat bakiyesi ( ) ile piyasa oranları ( ) arasındaki ilişkiyi analiz ediyorum. Basit bir doğrusal regresyon çalıştırırsam, korelasyon negatif ve oldukça önemlidir (-.74 civarında) Ancak, bağımlı değişkenin farkı ve bağımsız değişkenin farkı, bu nedenle denklemim ile geriledi , korelasyonlarım ve R ^ hiç önemli değil ( ).R T dYTRTddln(YT)R, 2 = .004dR(T)R2=.004

Sadece bu düşük şey ifade edip etmediğini merak ediyordum ? Bu, modelimin uygun olmadığı anlamına mı geliyor, yoksa farklı verilere baktığımda yok muyum? Verilerden orijinal iki değişken arasında önemli bir korelasyon olduğunu biliyorum, ancak modelim için değişkenlere bakmalıyım, bu yüzden sadece bu konuda nasıl gideceğimizi merak ediyorum.R 2R2R2

Yanıtlar:


16

Basit sürüm, zaman içinde bir yönde değişme eğilimi gösteren iki değişkenin, aralarında herhangi bir bağlantı olsun ya da olmasın, birbiriyle ilişkili gibi görünmesidir. Aşağıdaki değişkenleri göz önünde bulundurun:

set.seed(1)
time = seq(from=1, to=100, by=1)
x  = .5 + .3*time +        rnorm(100)
y1 =  3 + .3*time +        rnorm(100)
y2 =  7 + .1*time + .8*x + rnorm(100)

y 1 y 2 x x y 2 x y 1x , gibi sadece zamanın bir fonksiyonudur . hem zamanın hem de bir fonksiyonudur . Mesele, koddan gerçekten ve arasında bir ilişki olduğunu ve ile arasında bir ilişki olmadığını tanımaktır . Şimdi aşağıdaki şekle bakın, her üç çizgi de çok benzer görünüyor, değil mi?y1y2xxy2xy1

resim açıklamasını buraya girin

Aslında, ve arasındaki ilişki için değeri % 98'dir ve ve için değeri% 99'dur. Ama biliyoruz ki ve arasında gerçek bir ilişki yok , oysa ile arasında gerçek bir ilişki yok x y 1 R 2 x y 2 x y 1 x y 2R2xy1R2xy2xy1xy2, öyleyse gerçek olanı salt görünümden nasıl ayırt edebiliriz? Farklılıklar devreye giriyor. Değişkenlerden herhangi ikisi için, ikisi de zamanla yükselme eğilimi gösterdiğinden, bu çok bilgilendirici değil, ancak birinin belirli bir miktar yükseldiği göz önüne alındığında, bu bize diğerinin ne kadar yükseldiğini söylüyor mu? Farklılık bu soruya cevap vermemizi sağlar. Aşağıdaki üç şekle dikkat edin, üç değişkeni de farklılaştırdıktan sonra yaptığım dağılım grafikleri.

resim açıklamasını buraya girin

resim açıklamasını buraya girin

Burada, ne kadar yükseldiği hakkında bir şey bilmenin bize ne kadar yükseldiği hakkında bir şey söylediğini açıkça görüyoruz ( ), ancak ve ( için durum böyle değil ). Sorunuzun cevabı, orijinal değişkenleriniz arasındaki korelasyonları görmezden gelmeniz ve farklı değişkenlere bakmanız gerektiğidir. 2'nizin .004 olduğu göz önüne alındığında, gerçek bir ilişki olmadığını söyleyebilirim. y 2 R, 2 = .43 x y 1 R, 2 = .07 R ' 2xy2R2=.43xy1R2=.07R2

Diğer bazı noktalar: Şekillerde, bunların eşzamanlı değişiklikler olduğuna dikkat çekiyorum. Bunda yanlış bir şey yok ve bu sorunu benim kurma şeklimden kaynaklanıyor, ama genellikle insanlar bazı gecikmelerde etkilerle ilgileniyorlar. (Yani, bir noktada bir şeydeki değişiklik daha sonra başka bir şeyde değişime yol açar.) İkincisi, dizilerinizden birinin günlüğünü almayı söylersiniz. Günlüğü almak verilerinizi seviyelerden oranlara dönüştürür. Ve böylece, fark ettiğinizde, seviyedeki değişikliklerden ziyade oranlardaki değişikliklere bakıyorsunuz. Bu çok yaygın, ancak gösterime bu unsuru dahil etmedim; tartıştığım konularla dikey. Son olarak, zaman serisi verilerinin gösterimin izin verdiğinden daha karmaşık olduğunu kabul etmek istiyorum.


10

@gung güzel bir cevap veriyor, ama önerdiklerinize birkaç uyarı vermek istiyorum.

Farklılık çoğunlukla birim kök problemi ile mücadelede kullanılır, örneğin işlem AR (1) 1 korelasyon katsayısı ile olduğunda. Hata terimi beyaz gürültü olduğunda ( özellikle, seri korelasyon göstermez), @gung yukarıda gösterildiği gibi. Ancak, hata terimi mutlak değerde 1'den az bir korelasyon katsayısı ile seri korelasyona sahipse, doğrusal bir zaman eğilimini kaldırmak için fark kullanmak çok karmaşık bir yapıya sahip hatalar üretir. Bu durumda doğru standart hatalar elde etmek ve geçerli çıkarımlar yapmak zordur.

Sonuç olarak, önce bir birim kökünü test etmek ve eğer tespit edilirse, bunu farklılaştırma yoluyla düzeltmek en iyisidir. Ardından, doğrusal bir zaman eğilimi olup olmadığını kontrol edin. Bu sorunu düzelterek düzeltin. Sonuncusunu yapmadan, @ gung'un güzel bir şekilde gösterdiği, atlanan değişkenler türü soruna açık olursunuz.


1
+1 Bu cevabımın hoş bir tamamlayıcısı. Cevabımı basit ve sezgisel tutmaya çalıştım. Ancak, tartıştığımdan daha fazla karmaşıklık olduğu ve çok önemli olabileceği kesinlikle doğrudur. Bunu son paragrafımda kabul etmeliydim. Beni dürüst tuttuğun için teşekkürler.
gung - Monica'yı eski durumuna getirin

1

Amaç, iki veya daha fazla seri arasındaki ilişkiyi oluşturmak / tanımlamak olduğunda, durağan X değişkenini gürültüye dönüştürmek için filtrelenmesi gerekebilir. Bu iki aşamalı bir işlemdir, gerekli olan fark ve ARMA yapısı. Nesnelliği korumak ve Model Spesifikasyon Önyargısından kaçınmak için filtreyi varsaymamak, sabit X serisinin otokorelatif doğasını kullanarak bu filtreyi oluşturmak gerekir. Daha sonra Y serisini alır ve durağan hale getirmek için gerekli olan her türlü fark operatörü uygular ve daha sonra önceden geliştirilen filtreyi sabit Y'ye uygular. Bu prosedürün tek bir amacı vardır ve bu, Y ve X arasındaki ilişkiyi tanımlamaktır. Asla gerekli fark operatörleri hakkındaki sonuçlara atlanmamalıdır, ARMA filtresi ve bir tanesi verileri gözlemlemeden önce modeli bilen veya doğrudan yüce olanla konuşuyorsanız bir ekonometri uzmanı olmadıkça değişkenler arasındaki ilişki. Hesaplanabilecek herhangi bir istatistiksel teste inanmak için hata gereksiniminin normalliğine ilişkin dikkatli bir analiz gereklidir. F testlerinin / T testlerinin hesaplanması gereklidir, ancak yeterli değildir. Özet olarak "Transfer Fonksiyonu Modeli Nasıl Belirlenir" konusunu takip etmenizi öneririm. Diğerleri ve ben bu konuyu birkaç kez ele aldık. İsterseniz "zaman serileri" etiketine sahip soruların cevaplarından bazılarını inceleyebilirsiniz. Yogi'nin dediği gibi "Sadece okuyarak / izleyerek çok şey gözlemleyebilirsiniz". Bazen güzel ve basit cevaplar sizi saptırır ve benimki gibi potansiyel olarak aşırı karmaşık / muhafazakar cevaplar zaman serisi verilerini modellemeyi daha iyi anlamanıza ihtiyaç duyabilir. Bir zamanlar "Toto, artık Kansas'ta değiliz (yani kesitsel veriler)!"

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.