Bağımsızlık ve korelasyon arasındaki gerçek yaşamdan örnekler


9

Rasgele değişkenlerin bağımsızlığının sıfır korelasyonu olduğu, ancak sıfır korelasyonun bağımsızlık anlamına gelmediği iyi bilinmektedir.

Sıfır korelasyona rağmen bağımlılığı gösteren pek çok matematiksel örnekle karşılaştım. Bu gerçeği destekleyen gerçek yaşam örnekleri var mı?


2
Dikkatli olun, sadece sıfır korelasyon ve birlikte normal değişkenler bağımsızlık anlamına gelir.
Francis

2
@Siddesh "Ancak hacim uzunluğun doğrusal fonksiyonu olmadığından ilişkilendirilmezler." Pekala, tam olarak korelasyonlu değil . Ancak, bunlar pozitif korelasyon gösterecektir.
Silverfish

1
@Siddhesh: bu sadece E[length4]E[length]E[length3]=0...
Francis

1
Düzenlememe katılmıyorsanız, normal dağılım hakkındaki yorumu tekrar yapmaktan çekinmeyin. Ama bunun daha iyi kaldırılacağını düşündüm (1) ana sorunuz için dikkat dağıtıcı bir yan sorun, (2) (bence) daha önce CV'de zaten sorulmuştu, bu yüzden burada mevcut materyalin bir kopyası olacak, ( 3) Gelecekteki okuyucular arasında karışıklığa neden olmasını istemedim. Soruyu yeniden açılma şansını artıracak şekilde düzenlemeye çalıştım: Bu sorunun aynı konudaki "matematiksel istatistiklerden" oldukça farklı olduğunu düşünüyorum.
Silverfish

2
Ben hala bu sorunun gerçekten güzel olduğunu düşünüyorum ve yeniden açılmış olabilir eğer bazı daha ilginç cevaplar (bu şu anda bir kopya olarak kabul edilir iş parçacığı açıkça ayırt etmek için bazı düzenleme içerebilir) çekebilir. Meta'da bu sorunun yeniden açılması için ne gerekeceği hakkında bir konu açtım . Tüm yorumlar hoş geldiniz.
Silverfish

Yanıtlar:


6

Hisse senedi getirileri, ne istediğinin iyi bir gerçek hayat örneğidir. Bugünün ve dünün S&P 500 getirisi arasında sıfıra yakın bir ilişki var. Bununla birlikte, açık bir bağımlılık vardır: kare getiriler pozitif olarak otokorelasyonludur; yüksek volatilite dönemleri zaman içinde kümelenir.

R kodu:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

Günlük zaman çizelgeleri S&P 500'de geri döner:

günlük dönüş zaman çizelgeleri

Eğer dönüşler zamanla (ve durağan) bağımsız olsaydı, bu kümelenmiş volatilite modellerini görmek pek mümkün olmazdı ve kare günlük dönüşlerinde otokorelasyon görmezdiniz.


3

Diğer bir örnek, bir sınavdaki stres ve notlar arasındaki ilişkidir. İlişki ters U şeklindedir ve nedensellik oldukça açık görünse de korelasyon çok düşüktür.


2
Bu düzgün bir örnek. Sadece içgözlem / öğretim deneyimine dayanan verileriniz mi var?
Adrian

1
Bunun bir çalışmasını gördüm, ama yıllar önce gördüm, bu yüzden alıntıya veya gerçek verilere sahip değilim.
Peter Flom
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.