Normal dağıtılmış saat kesiti düzeltme


10

Tüm dünyaya dağıtılan yüzlerce bilgisayarda, belirli olayların oluşumunu ölçen bir denemem var. Olayların her biri birbirine bağlıdır, böylece onları artan sırayla sipariş edebilir ve sonra zaman farkını hesaplayabilirim.

Olaylar katlanarak dağıtılmalıdır, ancak bir histogram çizerken elde ettiğim şey budur:

Olayların histogramı

Bilgisayarlardaki saatlerin kesin olmaması, bazı olaylara bağımlı olduklarından daha önce bir zaman damgası atanmasına neden olur.

Saat senkronizasyonunun PDF'nin zirvesinin 0'da olmadığı (her şeyi sağa kaydırdığı) için suçlanıp suçlanamayacağını merak ediyorum?

Saatler farklılıkları normal olarak dağıtılırsa, efektlerin birbirini telafi edeceğini ve bu nedenle sadece hesaplanan zaman farkını kullanabileceğini varsayabilir miyim?

Yanıtlar:


13

Saat senkronizasyonu sorunları, zirvenin sağa kaymasına neden olabilir. Aşağıdaki R simülasyonu bu fenomeni göstermektedir. Resminizi kabaca andıran bir şekil elde etmek için üstel süreler ve normal saat farklılıkları kullandım :

saatler

Sola dağılımın (hatasız ölçülen gerçek farklar) tepe noktası 0'dır, sağdaki dağılımın (hata ile ölçülen farklar) tepe noktası 100'dür.

R-kod:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

Saat farkları ortalama 0 ile normal ise , farklar, gözlemlenen farkların ortalamasının gerçek farklara eşit olması anlamında iptal edilmelidir. Durumun böyle olup olmadığı, ilk olayın gerçekleştiği bilgisayarlar ile ikinci olayın gerçekleştiği bilgisayarlar arasında sistematik bir fark olup olmadığına bağlıdır.


4
+1 Güzel resimli. Matematiksel olarak, veriler hata dağılımı ve (varsayılan) üstel dağılımın toplamından alınır. Hata dağılımını tahmin etmek ve gerçek dağılımı tahmin etmek için verileri deşifre etmek cazip gelebilir .
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.