Merkezde 2B dağılım miktarını karakterize etmek için, sadece (kök) ortalama kare mesafesini,
σ^=RMS=1n∑i((xi−x¯)2+(yi−y¯)2)−−−−−−−−−−−−−−−−−−−−−−−√.
Bu formülde, (xi,yi),i=1,2,…,n nokta koordinatlarıdır ve onların sentroidleri (ortalamalar noktası) (x¯,y¯).
Soru mesafelerin dağılımını soruyor . Toplar izotropik iki değişkenli olduğunda, sentroidleri etrafında normal dağılım - standart ve fiziksel olarak makul bir varsayım - kare mesafe, iki serbestlik derecesine sahip (her bir koordinat için bir tane) ki-kare dağılımıyla orantılıdır. Bu, bağımsız standart normal değişkenlerin karelerinin toplamı olarak ki kare dağılımının bir tanımının doğrudan bir sonucudur, çünkü
xi−x¯=n−1nxi−∑j≠i1nxj
bağımsız normal değişkenlerin beklenti ile doğrusal bir kombinasyonudur.
E[xi−x¯]=n−1nE[xi]−∑j≠i1nE[xj]=0.
Ortak varyansının yazılması
xi gibi
σ2,
E[(xi−x¯)2]=Var(xi−x¯)=(n−1n)2Var(xi)+∑j≠i(1n)2Var(xj)=n−1nσ2.
Anizotropinin varsayımı,
yj ile aynı dağılıma sahip
xi ve onlardan bağımsız olduklarından,
(yj−y¯)2. Bu orantısallık sabitini oluşturur:
mesafelerin kareleri, iki serbestlik derecesine sahip,n−1nσ2.
Bu denklemlerin en ciddi testi durum n=2, o zaman kesir n−1n en çok farklı 1. Deneyi simüle ederek, hemn=2 ve n=40ve kareli mesafelerin histogramlarını ölçeklendirilmiş ki-kare dağılımları (kırmızı renkte) ile çizerek, bu teoriyi doğrulayabiliriz.
Her satır aynı verileri gösterir: solda x ekseni logaritmiktir; sağda gerçek kare mesafesini gösterir. Gerçek değeriσ çünkü bu simülasyonlar 1.
Bu sonuçlar aşağıdakilerle 100.000 yineleme içindir: n=2 ve 50.000 yineleme n=40. Histogramlar ve ki-kare yoğunlukları arasındaki anlaşmalar mükemmeldir.
olmasına rağmen σ2bilinmiyor, çeşitli şekillerde tahmin edilebilir. Örneğin, ortalama kare mesafesin−1nσ2 ortalamaları χ22, hangisi 2. İlen=40, örneğin, tahmin σ2 gibi 4039/2ortalama kare mesafesinin çarpımı. Böylece bir tahminσ olabilir 40/78−−−−−√RMS mesafesinin çarpımı. Değerlerini kullanmaχ22 daha sonra şunu söyleyebiliriz:
Mesafelerin yaklaşık% 39'u 39/40−−−−−√σ^, çünkü% 39 χ22 dağıtım daha az 1.
Mesafelerin yaklaşık% 78'i 3–√ zamanlar 39/40−−−−−√σ^, çünkü% 78 χ22 dağıtım daha az 3.
Ve böylece, yerine koymak istediğiniz herhangi bir çoklu için 1 veya 3. Bir kontrol olarak, için simülasyonlardan=40 önceden çizilmişse, kare mesafelerin gerçek oranları 1,2,…,10 zamanlar n−1nσ^2 idi
0.3932 0.6320 0.7767 0.8647 0.9178 0.9504 0.9700 0.9818 0.9890 0.9933
Teorik oranlar
0.3935 0.6321 0.7769 0.8647 0.9179 0.9502 0.9698 0.9817 0.9889 0.9933
Anlaşma mükemmel.
İşte R
yürütmek ve simülasyonları analiz kodu.
f <- function(n, n.iter, x.min=0, x.max=Inf, plot=TRUE) {
#
# Generate `n.iter` experiments in which `n` locations are generated using
# standard normal variates for their coordinates.
#
xy <- array(rnorm(n*2*n.iter), c(n.iter,2,n))
#
# Compute the squared distances to the centers for each experiment.
#
xy.center <- apply(xy, c(1,2), mean)
xy.distances2 <- apply(xy-array(xy.center, c(n.iter,2,n)), c(1,3),
function(z) sum(z^2))
#
# Optionally plot histograms.
#
if(plot) {
xy.plot <- xy.distances2[xy.distances2 >= x.min & xy.distances2 <= x.max]
hist(log(xy.plot), prob=TRUE, breaks=30,
main=paste("Histogram of log squared distance, n=", n),
xlab="Log squared distance")
curve(dchisq(n/(n-1) * exp(x), df=2) * exp(x) * n/(n-1),
from=log(min(xy.plot)), to=log(max(xy.plot)),
n=513, add=TRUE, col="Red", lwd=2)
hist(xy.plot, prob=TRUE, breaks=30,
main=paste("Histogram of squared distance, n=", n),
xlab="Squared distance")
curve(n/(n-1) * dchisq(n/(n-1) * x, df=2),
from=min(xy.plot), to=max(xy.plot),
n=513, add=TRUE, col="Red", lwd=2)
}
return(xy.distances2)
}
#
# Plot the histograms and compare to scaled chi-squared distributions.
#
par(mfrow=c(2,2))
set.seed(17)
xy.distances2 <- f(2, 10^5, exp(-6), 6)
xy.distances2 <- f(n <- 40, n.iter <- 50000, exp(-6), 12)
#
# Compare the last simulation to cumulative chi-squared distributions.
#
sigma.hat <- sqrt((n / (2*(n-1)) * mean(xy.distances2)))
print(cumsum(tabulate(cut(xy.distances2,
(0:10) * (n-1)/n * sigma.hat^2))) / (n*n.iter), digits=4)
print(pchisq(1:10, df=2), digits=4)