Eşit dağılmış iki nokta arasındaki beklenen mesafe nasıl bulunur?


9

Koordinatlar tanımlamak olsaydı ve(X1,Y1)(X2,Y2)

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

Aralarındaki mesafenin beklenen değerini nasıl bulabilirim?

, mesafe beklenen değer sadece ?(X1X2)2+(Y1Y2)2)(1/30+1/30)2+(1/40+1/40)2


LaTeX kodunuz doğru oluşturulmadı. Umarım düzeltmem istediğin şeydir
Peter Flom

Neredeyse, ama sonunda beni oraya götürdü, çok teşekkürler.
Mathlete

2
Matematik sitesinde eşdeğer soru: Dikdörtgendeki Rastgele Noktalar Arası Ortalama Mesafe . İlgili bir soru: Bir dikdörtgendeki düzgün rastgele noktaların Öklid mesafesinin belirli bir eşik değerinden daha az olması olasılığı . (Ne yazık ki, oradaki önerileri hakkında @whuber almaya hiç uğraşmadım. Bunu yapmak için biraz zaman bulmaya çalışacağım.)
Kardinal

1
Bu bağlantılar için teşekkürler, @cardinal. Matematik sürümü cevabı açıklamasa da - sadece sunar - incelemeye değer bir türetime bağlantılar içerir.
whuber

Yanıtlar:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

Aradığınızı doğru anlarsam, belki bu yardımcı olabilir. Rastgele noktalar arasındaki mesafeyi anlamaya çalışıyorsunuz, kimin X değerleri unif (0,30) 'den ve Y değerleri bir unif (0,40)' dan üretiliyor. Bunların her birinden dağıtımlara bir milyon RV oluşturdum ve sonra her biri için bir nokta oluşturmak için x ve y'yi bağladım. Sonra 2. ve 1. nokta arasındaki mesafeyi 1.000.000 ve 999.999 arasındaki mesafeye kadar hesapladım. Ortalama mesafe 18.35855 idi. Aradığın şey bu değilse bana bildirin.


Biçimlendirme için düzenleme özgürlüğü aldı.
curious_cat

2
Oldukça yakın geldiniz - belki de şans eseri. Gerçek cevap1108(871+960log(2)+405log(3)) = 18.345919. Kodunuzun iki sorunu vardır: (1) yinelemeler birbirinden bağımsız değildir; ve (2) makul bir hassasiyet elde etmek için, daha hızlı olacak şekilde kodlanmalıdır. Simülasyonu neden olduğu gibi doğrudan yapmıyorsunuz n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2). Bu, standart hatayı hesaplayarak kontrol edebileceğiniz için yaklaşık dört önemli rakamı (daha kısa sürede) alır sd(distance) / sqrt(n).
whuber

@whuber: # 1'inizi açıklayabilir misiniz? mesela (Vaka-I) Herhangi bir dağılımdan ve hesaplanan farklılıklardan rastgele sayılar çifti çizdim ve ortalama aldım. Versus (Durum-II) Bir seferde bir sayı çizmeye devam ettim ve son sayı çekişine göre çalışma farklılıklarını hesaplamaya devam ettim ve sonra ortalaması aldım. Vaka-I ve Vaka-II tarafından rapor edilen ortalama sistematik olarak farklı mıdır?
curious_cat

1
@curious_cat Hayır, ortalamalar yaklaşık olarak aynı olacaktır: ancak standart hatanın hesaplanması farklı olacaktır. Ortalamanın gerçek değere ne kadar yakın olabileceğini tahmin etmek için bu hesaplamaya ihtiyacımız var. Daha karmaşık SE hesaplaması yapmak yerine, tam olarak soruda belirtildiği gibi, birbirinden tamamen bağımsız olarak nokta çiftleri oluşturmak daha kolaydır. (Bir simülasyonun yanlış gitmesinin pek çok yolu vardır - deneyimden biliyorum! - simülasyonu gerçeği olabildiğince taklit etmek akıllıca olacaktır.)
Whuber

@whuber: Açıkladığınız için teşekkürler. Clark kodunu daha uzun süre çalıştırsaydı daha fazla ondalık basamağa sahip olabilirdi değil mi?
curious_cat

16

Soruya geometrik olarak bakıldığında, dışbükey bir kümedeki iki bağımsız, tekdüze, rastgele nokta arasındaki beklenen mesafenin çapının yarısından biraz daha az olacağı açıktır . (Daha az olmalıdır, çünkü iki noktanın köşeler gibi aşırı alanlarda bulunması nispeten nadirdir ve daha çok, yakın oldukları yerde merkeze yakın olacaklardır.) Bu dikdörtgenin çapı50, bu akıl yürütme ile tek başına cevabın biraz daha az olacağını tahmin ederiz. 25.

Kesin bir cevap , mesafenin olasılık-ağırlıklı değeri olarak beklentinin tanımından elde edilir. Genel olarak, bir kenar dikdörtgeni düşünün1 ve λ; daha sonra doğru boyuta ölçeklendireceğiz (ayarlayarakλ=40/30 ve beklentiyi 30). Bu dikdörtgen için koordinatları kullanma(x,y), eşit olasılık yoğunluğu 1λdxdy. Bu dikdörtgen içindeki ortalama mesafe şu şekilde verilir:

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

Temel entegrasyon yöntemlerini kullanarak bu basittir ancak yapılması acı vericidir; Cevabı elde etmek için bir bilgisayar cebir sistemi ( Mathematica ) kullandım

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

Varlığı 1+λ2bu terimlerin birçoğunda sürpriz yoktur: dikdörtgenin çapıdır (içindeki herhangi iki nokta arasındaki maksimum mesafe). Logaritmaların (arcsinh'i içeren) görünümü, basit düzlem rakamları içindeki ortalama mesafeleri araştırdıysanız da şaşırtıcı değildir: bir şekilde her zaman ortaya çıkar (bunun bir ipucu fonksiyonunun integralinde bir ipucu görünür). Bu arada,30 paydada bir kenar dikdörtgeni içeren sorunun özellikleri ile ilgisi yoktur 30 ve 40: evrensel bir sabittir.)

İle λ=4/3 ve bir faktör kadar ölçeklendirme 30, bu değerlendirir 1108(871+960log(2)+405log(3))18.345919.


Daha derinden durumu anlamak için bir yolu ortalama mesafe çizmektir göreli çapına1+λ2 değişen değerleri için λ. Aşırı değerler için (yakın0 veya daha büyük 1), dikdörtgen esasen bir boyutlu olur ve daha temel bir entegrasyon, ortalama mesafenin çapın üçte birine düşmesi gerektiğini gösterir. Ayrıca, çünkü dikdörtgenlerin şekilleriλ ve 1/λaynı ise, sonucu logaritmik bir ölçekte çizmek doğaldır .λhakkında simetrik olması gereken λ=1(kare). İşte burada:

Arsa

Bununla bir kural öğreniriz : bir dikdörtgen içindeki ortalama mesafe1/30.33 ve (yaklaşık) 0.37kare şeklindeki dikdörtgenler ile ilişkili daha büyük değerler ve uzun sıska (doğrusal) dikdörtgenler ile ilişkili daha küçük değerler ile. Bu uç noktalar arasındaki orta nokta, en boy oranına sahip dikdörtgenler için kabaca elde edilir.3:1. Bu düşünceyle kural ile, sadece edebilirsiniz bakışta bir dikdörtgenin en ve iki önemli rakamlara onun ortalama mesafeyi tahmin ediyoruz.


Bu "çap" yerine "köşegen" olmalı mı? Nitpicking ise özür dilerim.
curious_cat

@curious_cat Tanım olarak, bir nokta kümesinin (herhangi bir metrik uzaydaki) çapı, içindeki herhangi iki nokta arasındaki mesafelerin özetidir. Bir dikdörtgen için (açıkça) bir diyagonalin uzunluğudur.
whuber

Teşekkürler! Fark etmedim. Saf bir çap kavramı kullanıyordum.
curious_cat

Bir yana: Belirli bir alandaki tüm dikdörtgenler için bir kare için ortalama mesafe en aza indirilebilir mi?
curious_cat

2
Ruhu içinde bu , sana "Öyle bu cevabı başlatan isterdim uçağı ..." (1)
kardinal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.