Alındığı Tıbbi Araştırma Pratik İstatistik Douglas Altman sayfa 285 yazıyor:
... herhangi iki miktar X ve Y için, X, XY ile ilişkilendirilecektir. Gerçekten, X ve Y, rastgele sayılardan oluşan örnekler olsa bile, X ve XY arasındaki korelasyonun 0.7 olmasını beklerdik.
Bunu R'de denedim ve durum böyle görünüyor:
x <- rnorm(1000000, 10, 2)
y <- rnorm(1000000, 10, 2)
cor(x, x-y)
xu <- sample(1:100, size = 1000000, replace = T)
yu <- sample(1:100, size = 1000000, replace = T)
cor(xu, xu-yu)
Neden? Bunun arkasındaki teori nedir?