Bir hiper küp içindeki noktaların çoğunun sınırda olduğunu söylediğimizde ne anlama geliyor?


13

50 boyutlu bir hiperküpüm varsa. Ve sınırını 0<xj<0.05 veya , burada boyutudur. Daha sonra sınırındaki noktaların oranının hesaplanması olacaktır . Bunun anlamı ne? Alanın geri kalanı boş mu demektir? Eğer noktalarının sınırında olan daha sonra küp içinde noktaları düzgün yayılı edilmemelidir?0.95<xj<1xj0.99599%


3
Hayır, bu, çevrenin daha geniş olduğu ve etkinin boyutsallıkla orantılı olduğu anlamına gelir. Biraz mantıksız. Bu fenomenin, yüksek boyutlu uzaylarda en yakın komşuları kümelemek veya hesaplamak istediğinizde ilgili hale gelen rastgele düğüm çiftleri arasındaki mesafenin dağılımı üzerinde sonuçları vardır.
Emre

Bir çizgi segmentindeki noktaların hangi oranının sınırına yakın olduğunu hesaplayın. Sonra bir kareyi gösterir. Sonra bir küp işaret eder. Onlar hakkında ne söyleyebilirsin?
user253751

Yanıtlar:


28

' Hiper küp içindeki noktaların % 99% ' bahsetmek biraz yanıltıcıdır çünkü bir hiper küp sonsuz sayıda nokta içerir. Bunun yerine hacim hakkında konuşalım.

Bir hiper küpün hacmi, yan uzunluklarının ürünüdür. 50 boyutlu birim küp için

Total volume=1×1××150 times=150=1.

Şimdi bize 'de hiperküp ve görünüm sınırlarını hariç izin (matematiksel terim çünkü tırnak içinde bu koymak' çok farklı bir anlamı vardır). Sadece 0,05 < x 1 < 0,95'i karşılayan x=(x1,x2,,x50) noktalarını tutarız

0.05<x1<0.95 and 0.05<x2<0.95 and  and 0.05<x50<0.95.
Bu ''hacmin hacmi nedir? O '' yine hiperküp ve her bir kenarının uzunluğu olan0.9 (=0.95-0.05 ... iki ve üç boyutlu olarak bu hayal etmek yardımcı olur). Böylece hacim
İç hacim=0.9x0.9xx0.950 zamanlar=0.9500.005.
'Hacmi sonucunasınır' ( "olmadan birim olarak tanımlanan hiperküp ') 10.9500.995.

Bu, 50 boyutlu bir hiperküp hacminin % 99.5% ' sınırı ' üzerinde yoğunlaştığını gösterir .


Takip: ignatius bunun olasılıkla nasıl bağlantılı olduğuna dair ilginç bir soru ortaya attı . İşte bir örnek.

Diyelim ki 50 girdi parametresine göre konut fiyatlarını tahmin eden bir (makine öğrenimi) modeli buldunuz. 50 giriş parametresinin tümü bağımsızdır ve 0 ile 1 arasında eşit olarak dağıtılır .01

0.050.950.050.95

10%5010.9500.995.99.5%

Temel kural: Yüksek boyutlarda, aşırı gözlemler kural değildir, istisna değildir.


7
OP'nin "Alanın geri kalanının boş olduğu anlamına mı geliyor?" ve cevaplama: Hayır, alanın geri kalanının nispeten küçük olduğu anlamına gelir . . . Ya da kendi kelimelerinizle benzer. . .
Neil Slater

2
"Boyutsallığın laneti" teriminin gerçekten güzel açıklaması
ignatius

Aşağıdakilerin doğru olup olmadığını merak etmek: bu örneği almak, bir dizi özellik 50 boyutun her birinde [0,1] boyunca eşit olarak dağıtılırsa, hacmin (% 99,5 -% 0,5) =% 99'u (hiper küp özelliği) boşluk) her bir özelliğin yalnızca% 10'unu alır
ignatius

"Verilen herhangi bir giriş parametresi, sadece% 5 olasılıkla aşırı." Bence bu olasılık% 10.
Rodvi

@Rodvi: Elbette haklısın, teşekkürler! Onu düzeltti.
Elias Strehle

9

Deseni daha düşük boyutlarda bile net bir şekilde görebilirsiniz.

1. boyut. 10 uzunluğu ve 1 sınırı alın. Sınır uzunluğu 2 ve iç mekan 8, 1: 4 oranıdır.

2. boyut. 10. tarafın karesini alın ve sınır 1'i tekrar alın. Sınır alanı 36, iç 64, 9:16 oranıdır.

3. boyut. Aynı uzunluk ve sınır. Sınırın hacmi 488, iç mekan 512, 61:64 - zaten sınır iç mekan kadar neredeyse yer kaplıyor.

4. boyut, şimdi sınır 5904 ve iç 4096 - sınır şimdi daha büyük.

Daha küçük ve daha küçük sınır uzunlukları için bile, boyut arttıkça sınır hacmi her zaman iç kısmı geçecektir.


0

Bunu "anlamanın" en iyi yolu (bir insan için IMHO imkansız olmasına rağmen) n-boyutlu bir top ve n-boyutlu bir küpün hacmini karşılaştırmaktır. N (boyutsallık) büyümesi ile topun tüm hacmi "dışarı sızar" ve küpün köşelerinde yoğunlaşır. Bu, kodlama teorisinde ve uygulamalarında hatırlanması gereken yararlı bir genel prensiptir.

En iyi ders kitabı açıklaması Richard W. Hamming'in "Kodlama ve Bilgi Teorisi" kitabındadır (3.6 Geometrik Yaklaşım, s. 44).

Wikipedia kısa makale , bir n boyutlu birim küp hacmi her zaman 1 ^ n olduğunu akılda tutmak eğer sana aynı kısa bir özetini verecektir.

Umarım yardımcı olur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.