Bir p-norm topundan eşit gürültü (


11

Ben boyutları bir p-norm topu gelen düzgün dağıtılmış gürültü üreten bir işlev yazmaya çalışıyorum :n

||x||pr

Çevreler için olası çözümler buldum ( ) ( http://mathworld.wolfram.com/DiskPointPicking.html ), ancak bunu farklı değerleri için genişletmede sorun yaşıyorum .p=2p

Bunu sadece düzgün bir dağılımdan rastgele bir örnek çizerek ve verilen kısıtlamayı karşılamadığında yeniden çizerek denedim. Bununla birlikte, çirkin bir çözüm olmasının yanı sıra, yüksek boyutlar için hesaplama açısından da olanaksız hale gelir.


1
Cevabı burada Öklid mesafesi (p = 2) kullanarak n boyutlu bir küre için bulabilirsiniz math.stackexchange.com/questions/87230/… Ancak yine de farklı p-normları için nasıl kullanılacağından emin değilim, sadece mesafe için farklı bir ilişkide kullanılan Öklid mesafesini değiştirmek?
Taeke de Haan

2
Çok sayıda kağıt var, ancak çoğu ödeme duvarının arkasında: link.springer.com/article/10.1007/s00184-011-0360-x veya bkz. Google.com/…
kjetil b halvorsen

3
Hangi hacim metriğine göre "düzgün"? Sonuçta, bir topu kullanıyorsanız , neden Öklid hacmi ilginizi çeker? p
whuber

@whuber Dürüstçe emin değilim, çünkü bu ödevde açıkça belirtilmedi, ancak bu durumda başka herhangi bir metrik keyfi gibi göründüğünden, p-normda beklenebilirim.
Taeke de Haan

1
Sorun bir Makine Öğrenimi ödevinden kaynaklanmaktadır; "Sorun 204 boyutta iki sınıflı bir sınıflandırma sorunudur. Küçük etiketli eğitim seti sınıf başına 50 örnek büyüklüğüne sahiptir. Etiketlenmemiş veriler 20.000 ek örnek sağlar. Ancak bu örnekler bir çeşit bozulmaya uğramıştır. yalnızca bu yolsuzluk hakkında ek bilgilerimiz, bunun tek tip homojen gürültü olması ve gürültünün , hem p hem de yarıçap r'nin bilinmediği sabit bir p-norm topu, . " Etiketlenmemiş verilerde en düşük hata oranını almam gerekiyor. ||x||prpr
Taeke de Haan

Yanıtlar:


5

Tam çözümü kjetil b halvorsen tarafından önerilen bir makalede buldum ( https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=758215 ). Dürüst olmak gerekirse, arkasındaki matematiği anlamakta zorlanıyorum, ancak nihai algoritma oldukça basit. Elimizdeki eğer boyutları, yarıçap r ve norm p daha:nrp

1) oluşturmak bağımsız rastgele gerçek skalerler £ i = ˉ G ( 1 / p , p ) , ˉ G ( μ , σ 2 ) üs farklı güç ile Genelleştirilmiş Gauss dağılımı (olduğunu e - | x | s yerine sadece p = 2 )nεben=G,¯(1/p,p)G,¯(μ,σ2)e-|x|pp=2

2) s iε i bileşenlerinin vektörünü oluşturun , burada s i bağımsız rastgele işaretlerdirxsben*εbensben

3) üretir , burada w [0, 1] aralığında eşit olarak dağılmış rastgele bir değişkendir.z=w1/nw

4) dönüş y=rzx||x||p


2
için cevabınızda G'nin ne olduğunu söyleyebilir misiniz ? G,
Stéphane Laurent

Güncellenmiştir
Taeke de Haan

2
G genelleştirilmiş Gauss dağılımıdır ( üssünde sadece p = 2 yerine farklı bir güce sahip ). Bu , tekli pdfs'nin ürünü olan çoklu bağımsız genelleştirilmiş gauss dağıtılmış değişkenlerden ( x i) oluşan x vektörü için dağılımı , p-normuna bağlı hale getirecektir . f ( x ) e - | x | p pe|x|pp=2xxi
f(x)e|x|pp
Sextus Empiricus

@MartijnWeterings Çok teşekkürler, güncellendi.
Taeke de Haan

Teşekkürler. Bilgi için, R paket pgnormunda bu dağılımın bir örneği vardır .
Stéphane Laurent

3

Homojen olarak dağıtılmış çok değişkenli değişkenler kullanma

Taeke, özellikle 2 norm ve 1 normlu durumları açıklayarak aşağıdaki metnin daha sezgisel hale getirdiği bir makaleye bağlantı sağlar.

2-norm x2r

örnek yönü

Bu sonucu http://mathworld.wolfram.com/HyperspherePointPicking.html kullanabilirsiniz

Çok değişkenli Gauss dağıtılmış değişken (kimlik kovaryans matrisi ile) yalnızca karelere olan uzaklığa veya toplama bağlıdır.X

f(X1,X2,...,Xn)=Π1benn12πe12xben2=12πe12Σ1bennxben2

Böylece eşit n-boyutlu-hiperkürenin yüzeyine dağıtılır.XX2


örnekleme mesafesi

Tamamlamak için sadece mesafeyi örneklemeniz, küre üzerindeki homojen dağılımı bir topun homojen dağılımına değiştirmeniz gerekir. (disk noktası toplama için bağlantılı örneğinize az çok benzer)

Sadece örnek eğer düzgün bir dağılım olarak daha sonra merkezi nispeten yüksek bir yoğunluğa (hacim olarak ölçekleri olurdu r n bir kısmı bu nedenle R noktaları bir hacim içinde sona ereceğini r n daha yoğun yakın olan, ve tekdüze bir dağılım anlamına gelmez)rrnrrn

Bunun yerine , tekdüze bir dağılımdan örneklenen bir değişkenin kökünü kullanırsanız, eşit bir dağılım elde edersiniz.n

x1r

yön

XX|X|1

Resmi bir kanıtım yok, sadece sezgi

f(x)dVf(x)dbir

ama simülasyonlarla test etmek iyi görünüyor.

eşit olarak dağıtılmış 20000 değer toplama simülasyonu

library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)

xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
     sqrt((0.5-0.5*(xi+yi))^2+zi^2),
     pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)

mesafe

rn

xpr

f(x)αe|x|pG,()


1
p

1
nrpz=w1/nwy=rzx||x||p
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.