1/2n
Standart terimlerle ilgili karışıklık potansiyeli vardır. Soruda belirtilen mutlak korelasyon, onu oluşturan istatistiklerle birlikte - farklılıklar ve kovaryanslar - rastgele bir yürüyüşün herhangi bir gerçekleşen çiftine uygulanabilecek formüllerdir . Soru, birçok bağımsız gerçekleşmeye baktığımızda olanlarla ilgilidir. Bunun için rastgele yürüyüş sürecinden beklentiler almamız gerekiyor .
(Düzenle)
(X,Y)(Xt,Yt)Xt+1,Yt+1YXYYX01
15960
Bu eğimler oldukça geniş olma eğilimindedir. Mükemmel olarak rastgele bu noktaların rastgele saçılma noktalarının daima sıfıra çok yakın eğimleri olacaktır . Burada ortaya çıkan kalıpları tanımlamamız gerekirse, 2B rastgele yürüyüşün çoğunun kademeli olarak bir konumdan diğerine geçtiğini söyleyebiliriz . (Ancak bunlar mutlaka başlangıç ve bitiş noktalarının konumları değildir!) O zaman yaklaşık yarısı, o zaman bu göç çapraz yönde gerçekleşir - ve eğim buna göre yüksektir.
Bu yazının geri kalanı bu durumun bir analizini çiziyor.
(Xi)(W1,W2,…,Wn)Wiσ2
x=(x1,…,xn)
V(x)=1n∑(xi−x¯)2.
Bu değeri hesaplamanın iyi bir yolu, tüm kare farklılıklarının ortalamasının yarısını almaktır:
V(x)=1n(n−1)∑j>i(xj−xi)2.
xXn
E(V(X))=1n(n−1)∑j>iE(Xj−Xi)2.
Farklılıklar, iid değişkenlerinin toplamıdır.
Xj−Xi=Wi+1+Wi+2+⋯+Wj.
WkWkσ2
E((Wi+1+Wi+2+⋯+W2j))=(j−i)σ2.
Bunu kolayca takip eder
E(V(X))=1n(n−1)∑j>i(j−i)σ2=n+16σ2.
xy
E(C(X,Y)2)=3n6−2n5−3n2+2n480n2(n−1)2σ4.
Sonuç olarak, arasındaki kare korelasyon katsayısının beklentisidir.XYn
ρ2(n)=E(C(X,Y)2)E(V(X))2=3403n3−2n2+3n−2n3−n.
9/400.47ρ(n)
ρ2(n)1000ρ2(n)n|ρ(n)|
R
Şekil üretmek için kod budur .
f <- function(n){
m <- (2 - 3* n + 2* n^2 -3 * n^3)/(n - n^3) * 3/40
}
n.sim <- 1e4
par(mfrow=c(1,4))
for (n in c(3, 10, 30, 100)) {
u <- matrix(rnorm(n*n.sim), nrow=n)
v <- matrix(rnorm(n*n.sim), nrow=n)
x <- apply(u, 2, cumsum)
y <- apply(v, 2, cumsum)
sim <- rep(NA_real_, n.sim)
for (i in 1:n.sim)
sim[i] <- cor(x[,i], y[,i])^2
z <- signif(sqrt(n.sim)*(mean(sim) - f(n)) / sd(sim), 3)
hist(sim,xlab="rho(n)^2", main=paste("n =", n), sub=paste("Z =", z))
abline(v=mean(sim), lwd=2, col="Red")
abline(v=f(n), col="Blue", lwd=2, lty=3)
}