Basit sürüm, zaman içinde bir yönde değişme eğilimi gösteren iki değişkenin, aralarında herhangi bir bağlantı olsun ya da olmasın, birbiriyle ilişkili gibi görünmesidir. Aşağıdaki değişkenleri göz önünde bulundurun:
set.seed(1)
time = seq(from=1, to=100, by=1)
x = .5 + .3*time + rnorm(100)
y1 = 3 + .3*time + rnorm(100)
y2 = 7 + .1*time + .8*x + rnorm(100)
y 1 y 2 x x y 2 x y 1x , gibi sadece zamanın bir fonksiyonudur . hem zamanın hem de bir fonksiyonudur . Mesele, koddan gerçekten ve arasında bir ilişki olduğunu ve ile arasında bir ilişki olmadığını tanımaktır . Şimdi aşağıdaki şekle bakın, her üç çizgi de çok benzer görünüyor, değil mi?y1y2xxy2xy1

Aslında, ve arasındaki ilişki için değeri % 98'dir ve ve için değeri% 99'dur. Ama biliyoruz ki ve arasında gerçek bir ilişki yok , oysa ile arasında gerçek bir ilişki yok x y 1 R 2 x y 2 x y 1 x y 2R2xy1R2xy2xy1xy2, öyleyse gerçek olanı salt görünümden nasıl ayırt edebiliriz? Farklılıklar devreye giriyor. Değişkenlerden herhangi ikisi için, ikisi de zamanla yükselme eğilimi gösterdiğinden, bu çok bilgilendirici değil, ancak birinin belirli bir miktar yükseldiği göz önüne alındığında, bu bize diğerinin ne kadar yükseldiğini söylüyor mu? Farklılık bu soruya cevap vermemizi sağlar. Aşağıdaki üç şekle dikkat edin, üç değişkeni de farklılaştırdıktan sonra yaptığım dağılım grafikleri.


Burada, ne kadar yükseldiği hakkında bir şey bilmenin bize ne kadar yükseldiği hakkında bir şey söylediğini açıkça görüyoruz ( ), ancak ve ( için durum böyle değil ). Sorunuzun cevabı, orijinal değişkenleriniz arasındaki korelasyonları görmezden gelmeniz ve farklı değişkenlere bakmanız gerektiğidir. 2'nizin .004 olduğu göz önüne alındığında, gerçek bir ilişki olmadığını söyleyebilirim. y 2 R, 2 = .43 x y 1 R, 2 = .07 R ' 2xy2R2=.43xy1R2=.07R2
Diğer bazı noktalar: Şekillerde, bunların eşzamanlı değişiklikler olduğuna dikkat çekiyorum. Bunda yanlış bir şey yok ve bu sorunu benim kurma şeklimden kaynaklanıyor, ama genellikle insanlar bazı gecikmelerde etkilerle ilgileniyorlar. (Yani, bir noktada bir şeydeki değişiklik daha sonra başka bir şeyde değişime yol açar.) İkincisi, dizilerinizden birinin günlüğünü almayı söylersiniz. Günlüğü almak verilerinizi seviyelerden oranlara dönüştürür. Ve böylece, fark ettiğinizde, seviyedeki değişikliklerden ziyade oranlardaki değişikliklere bakıyorsunuz. Bu çok yaygın, ancak gösterime bu unsuru dahil etmedim; tartıştığım konularla dikey. Son olarak, zaman serisi verilerinin gösterimin izin verdiğinden daha karmaşık olduğunu kabul etmek istiyorum.