İki rasgele birim vektörün skaler ürünlerinin boyutunda dağılımı


27

Eğer ve iki bağımsız rasgele birim vektörlerdir kendi sayısal ürün (nokta ürün) dağılımı ne (homojen bir birim küre üzerinde dağıtılmaktadır), ?y Ar D xyxyRDxy

Gibi tahmin hızlı bir şekilde dağılımı büyür (?), Sıfır ortalama ve daha yüksek boyutlarda azalan varyans normal olur ancak için açık bir formül yoktur \ sigma ^ 2 (D) ?D

limDσ2(D)0,
σ2(D)

Güncelleştirme

Bazı hızlı simülasyonlar yaptım. İlk olarak, D = 1000 için 10000 çift rasgele birim vektör D=1000üretmek, nokta ürünlerinin dağılımının kusursuz bir Gauss olduğunu (aslında D = 100 için zaten oldukça Gauss olduğunu) görmek kolaydır D=100, soldaki alt kısma bakınız. İkincisi, 1 ila 10000 arasında değişen her D için (artan adımlarla) 1000 çift oluşturdum ve varyansı hesapladım. Log-log arsa sağda gösterilmiştir ve formülün 1 / D ile çok iyi bir şekilde yaklaştığı açıktır 1/D. Not Bunun için D=1 ve D=2 Bu formülü bile verir kesin sonuçlar (ama emin sonradan ne değilim).

rastgele birim vektörler arasındaki nokta ürünleri


@KarlOskar: teşekkür ederim, bu bağlantı çok alakalı ve aslında sorumu neredeyse iki katına çıkarıyor , ama tam olarak değil. Bu yüzden , nokta ürünlerinin kümülatif bir dağılım fonksiyonu olan için açık bir formül vardır . Biri PDF'yi almak için bir türev alabilir ve daha sonra limitini çalışabilir . Bununla birlikte, formül beta fonksiyonları ve eksik beta fonksiyonları açısından verilmiştir, bu nedenle hesaplamalar kötü olabilir. D P{(x,y)>ϵ}D
amip diyor Reinstate Monica

@KarlOskar: içindeki birim alandaki düzgün dağılımdan . Bu dağılımdan rastgele bir vektör üretmek için, bir birim değişkeni olan bir Gaussian'dan rastgele bir vektör üretilebilir ve ardından normalleştirilebilir. RD
amip diyor Reinstate Monica

Yanıtlar:


30

( İyi bilindiği gibi ), birim alanı üzerinde düzgün bir dağılım elde edildiğinden, bir değişken normal dağılım normalleştirilerek elde edilir ve normalleştirilmiş vektörlerin nokta ürünü onların korelasyon katsayısıdır, üçe cevaplar sorular: D tSD1Dt

  1. ( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 , Beta dağılımına sahiptir.((D1)/2,(D1)/2)

  2. Varyans eşittir (söz konusu iddia gibi).t1/D

  3. Bir standart dağılımı bir oranda normalliği yaklaşımlartO(1D).


Yöntem

Tam birim vektörlerin iki nokta arasında dağılım kolayca geometrik elde edilir , bu birinci yönünde ikinci vektörün bileşenlerinden birisidir. İkinci vektör birinciden bağımsız olduğundan ve ünite küresi üzerinde düzgün bir şekilde dağıldığından, birinci yöndeki bileşeni kürenin herhangi bir koordinatıyla aynı şekilde dağıtılır. (İlk vektörün dağılımının önemli olmadığını unutmayın.)

Yoğunluğu Bulmak

Bu koordinatın son olmasına izin vererek, deki yoğunluk , birim küre üzerindeki ile arasındaki bir yükseklikte bulunan yüzey alanıyla orantılıdır . Bu oran yüksekliği bir kayış içinde meydana ve yarıçap esas olarak a, konik kesik koni bir takım inşa yarıçaplı yüksekliği ve eğim . Olasılık ile orantılı olduğut t + d tt[1,1]tt+dtdtS D1-t2,SD-2dt1-t2,dt1/1-t2

(1-t2)D-21-t2dt=(1-t2)(D-3)/2dt.

İzin vermek gerektirir bir . Bunu bir önceki öğenin içine yerleştirmek, olasılık elemanına normalleştirici bir sabite kadar verir:t = 2u=(t+1)/2[0,1]t=2u-1

fD(u)duα(1-(2u-1)2)(D-3)/2d(2u-1)=2D-2(u-u2)(D-3)/2du.

O hemen bir bir Beta vardır dağılımı, yoğunluğu da orantılı olduğu için (tanımı gereği)( ( D - 1 ) / 2 , ( D - 1 ) / 2u=(t+1)/2((D-1)/2,(D-1)/2)

u(D-1)/2-1(1-u)(D-1)/2-1=(u-u2)(D-3)/2αfD(u).

Sınırlama Davranışını Belirleme

Sınırlama davranışı hakkındaki bilgiler temel teknikleri kullanarak bu durumdan kolayca gelir: , orantılılık sabitini elde etmek için entegre edilebilir ; , varyansın ve daraldığını gösteren (örneğin, Chebyshev'in Teoremi tarafından olasılık yakınlaştığını gösteren anlar elde etmek için (örneğin, Beta fonksiyonlarının özelliklerini kullanarak entegre edilebilir ); ve sınırlayıcı dağılım daha sonra küçük değerler için orantılı, standartlaştırılmış dağılımın yoğunluğunun değerleri göz önüne alınarak bulunur .Γ (fDtkfD(t)1/D0t=0fD(t)Γ(n2)πΓ(D-12)tkfD(t)1/D0t=0tfD(t/D),t :

günlük(fD(t/D))=C(D)+D-32günlük(1-t2D)=C(D)-(1/2+32D)t2+O(t4D)C-12t2

entegrasyon sabitlerini (log) temsil ettiği yerde . Açıkça , bunun normale yaklaşma oranı (log yoğunluğunun eşit olduğu)- 1CO(1-12t2O(1D).

şekil

Bu çizim nokta ürününün, için birim varyansa göre standardize edilmiş yoğunluklarını ve sınır yoğunluklarını gösterir. değerindeki değerler ile artar (standart normal yoğunluk için maviden kırmızıya, altından sonra yeşil olur). için yoğunluk bu çözünürlükteki normal yoğunluktan ayırt edilemez.0 D D = 1000D=4,6,100DD=1000


4
(+1) Çok teşekkürler, @whuber, bu harika bir cevap! "Frustum" kelimesini yazdığınız için teşekkür ederiz. Öyle olur ki, sizinkini yayınlamadan birkaç dakika önce başka bir cevabı kabul ettim ve şimdi bunu kabul etmek istemem; umarım anlarsın. Her ikisini de kabul etmenin mümkün olmaması üzücü! Bu arada, bu cevaptan sapma için ifadesinin çok basit bir kanıtına dikkat edin : biri beta işlevleriyle uğraşmadan doğrudan görebilir! Nokta ürünün Varyans herhangi küre (yazdığın gibi) koordinat ve tüm bir toplamının varyansı eşittir olmalı bunlardan , QEDD 11/DD1
amip eski haline Monica diyor

1
Varyanslarla ilgili güzel bir gözlem.
whuber

2
@ amoeba, son etkinlik yine burada dikkatimi çekti ve cevabımı kabul ettiğin için minnettar olduğum kadar, bu çok daha dolgun. Değişsen hiç umursamıyorum.
ekvall

1
@ Student001: Bu adil ve cömert bir yorumdur. Kabul edilen cevabı değiştirdim. Ayrıca telafi etmek için bir tane Q ve senin de bir tane buldum :)
amip, diyor

1
@ mat dağılımı 2 U - 1 [ 0 , 1 ] [ - 1 , 1 ]t olduğu bir . Bu, ölçeklendirilen ve aralığından aralığına kaydırılan bir Beta dağıtımı yapar . 2U-1[0,1][-1,1]
whuber

11

Dağılımı bulalım ve sonra varyans standart sonuçlarla takip edilir. Vektör ürününü göz önünde bulundurun ve bunun kosinüs formuna yazın, yani aslında elimizde sadece ve arasındaki açı olduğunu unutmayın.θ x y A B E P ( A B ) : = E [ E [ χ

P(xyt)=P(|x||y|cosθt)=P(cosθt)=EP(cosθty),
burada ve arasındaki açıdır . Son adımda, ve olayları için kullandımŞimdi terimini düşünün . O zamandan bu yana olduğu açıktır küre yüzeyine göre düzgün alınmış ise ne fark etmezθxyAB P ( cos θ t y ) x y
EP(AB):=E[E[χAB]]=EχA=P(A).
P(cosθty)xyy y y = = [ 1 , 0 , 0 , ] . P ( x y t ) = P ( x 1t ) . x 1 R, n , x ' y 1 / nxy önemlidir. Böylece, beklenti içindeki terim aslında bir fonksiyonu olarak sabittir ve olduğunu varsayabilirizArdından elde ettikancak , içindeki normalize edilmiş bir Gaussian vektörünün ilk koordinatı olduğundan , bu makalenin asimptotik sonucunu çağırarak varyanslı olduğunu .yy=[1,0,0,].
P(xyt)=P(x1t).
x1Rn,xy1/n

Varyansın açık bir sonucu için, nokta ürünün bağımsızlıkla sıfır anlamına geldiği ve yukarıda gösterildiği gibi ilk koordinatı gibi dağıtıldığı gerçeğini kullanın.x . Bu sonuçlara göre, bulmak, değerini bulmaktır . Şimdi, yapım başına olduğuna dikkat edin, böylece burada son eşitlik koordinatlarının aynı şekilde dağıtılmasından kaynaklanır. Her şeyi bir araya koyarak, olduğunu bulduk.Var(xy)Ex12x'x=1

1=Ex'x=EΣben=1nxben2=Σben=1nExben2=nEx12,
xvar(x'y)=Ex12=1/n

Teşekkür ederim, ama kafam karıştı: “istenen sonuç” tam olarak nedir ve son denklemden nasıl takip edilir? Son olasılık dağılımı D'ye bağlı olmalıdır D.
amip diyor Reinstate Monica

Aslında sonucun son denkleminizden nasıl geçtiği , bulduğunuz matematikle ilgili tartışılan şeydir . Beta dağıtımları vb. İçerir ve sınırlayıcı davranış (benim için) bariz olmaktan uzaktır. Sanırım olduğunu görmenin daha basit bir yolu olmalı . σ2(D)1/D
amip diyor Reinstate Monica

Bu, , çünkü üretilen Gaussian vektörü olduğu boyutuna bağlıdır . Cevabı daha sonra bugün veya yarın güncelleyeceğim. zx1=z1|z|-1z
ekvall

Vay canına, son bağlantınız sayfa 1'deki üçüncü denklemde ters beta fonksiyonlarını (hesaplamaktan korktuğum) içeren bu ifadenin sınırını sağlar. Dolayısıyla, mantığını tamamlamak için: küre yarıçapı , sonra (asimptotik olarak) olarak dağıtılır . Bu, birim yarıçap varyansının küresi için katının daha küçük, yani olduğu anlamına gelir . Bununla birlikte, hala bir endişem var: 1'den 4'e kadar kontrol ettim ve 1 veya D = 2 için dağılımlar normalden çok uzak olsa bile, tam bir farklılık gösteriyor gibi görünüyor . Bunun arkasında daha derin bir sebep olmalı. x1N(0,1)D1/DDDx1N-(0,1)D1/DD1/D
amip diyor Reinstate Monica

@ amoeba Evet, bunun bir kanıtı ile güncellendi.
ekvall

2

Sorunuzun ilk bölümünü yanıtlamak için, . Tanımlama ürün elemanlar ve ve burada gösterildiği gibi sadece ortak dağılımına göre dağıtılacak vef Z ı ( z i ) = - f Z 1 , ... , Z, D ( z 1 , ... , z D )Z=X,Y=ΣXbenYben

fZben(zben)=-fZ1,...,ZD(z1,...,zD)dzben
benthXYZbenXbenYben . sonra ,
fZben(zben)=-fXben,Yben(x,zbenx)1|x|dx
Z=ΣZben
fZ(z)=-...-fZ1,...,ZD(z1,...,zd)δ(z-Σzben)dz1...dzd

İkinci bölüm için, eğer asemptotik davranışları hakkında ilginç bir şey söylemek istersen σ istiyorsanız, en azından ve bağımsızlığını üstlenmeniz ve ardından bir CLT uygulamanız gerektiğini düşünüyorum.XY

Örneğin eğer kabul etmeye istekli olsaydı, bu olan IID ile ve sen olabilir olduğunu söyleyinE [ Z i ] = μ V [ Z i ] = σ 2 σ 2 ( D ) = σ 2{Z1,...,ZD}E[Zben]=μV[Zben]=σ2 limD∞ ikenσ2(D)=0σ2(D)=σ2D ve .limDσ2(D)=0


XYσ2(D)=Vbirr(zben)/DVbirr(zben)DVbirr(zben)=1/2yanılmıyorsam, bunun daha yüksek boyutlarda geçerli olup olmadığını merak ediyorum ...
amip Reinstate Monica

zbenXY

Vbirr(zben)Vbirr(z)1/D
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.