“Rastgele projeksiyon” kesinlikle bir projeksiyon değil mi?


10

Rastgele Projeksiyon algoritması Mevcut uygulamaları onları eşleyerek veri örnekleri boyutunu azaltmak üzere using izdüşüm matrisi Girişleri gelen, örneğin, uygun bir dağılım (dan iid ):R,dR,kdxkR,N-(0,1)

x'=1kxR,

Uygun olarak, bu eşlemenin yaklaşık olarak çift mesafeleri koruduğunu gösteren teorik kanıtlar mevcuttur.

Ancak, son zamanlarda bu notları buldum , yazarın rastgele bir matris ile bu eşlemenin kelimenin tam doğrusal cebirsel anlamında bir projeksiyon olmadığını iddia ettiği yerde buldum (sayfa 6). Orada verilen açıklamalardan, bunun nedeni, girişleri bağımsız olarak den seçildiğinde , sütunlarının kesinlikle dik olmamasıdır . Bu nedenle, kolonlarının dikliğinin uygulandığı RP'nin önceki versiyonları bir projeksiyon olarak düşünülebilir.R,N-(0,1)R,

(1) bu katı anlamda bir projeksiyonun tanımı nedir ve (2) RP bu tanım altında neden bir projeksiyon değil? Hakkında daha ayrıntılı bir açıklama sağlayabilir misiniz?


1
Sitemizde arama yaparak (1) 'e cevap bulabilirsiniz . (2) iddiası hemen gerçekleşir, çünkü sütunlar her zaman dik olsaydı, girdileri bağımsız olamazdı.
whuber

Yanıtlar:


4
  1. Bu katı (doğrusal cebirsel) anlamda bir projeksiyonun tanımı nedir (kelimenin)

    https://en.wikipedia.org/wiki/Projection_(linear_algebra)

    Lineer cebir ve fonksiyonel analizlerde, bir çıkıntı, bir lineer dönüşümdür , kendisi için bir vektör boşluğundan bu şekilde . Yani, herhangi bir değere iki kez uygulandığında, bir kez uygulanmış gibi aynı sonucu verir (idempotent).PP2=PP

    Ortogonal projeksiyon veya vektör projeksiyonu için

    https://en.wikipedia.org/wiki/Projection_(linear_algebra)

    Ortogonal bir projeksiyon, U aralığının ve boş V boşluğunun dikey alt uzaylar olduğu bir projeksiyondur.

  2. RP neden bu tanım altında bir projeksiyon değil?

    Michael Mahoney dersinizde RP'nin nasıl yapılandırıldığına , RP'nin geleneksel lineer cebirsel anlamda bir projeksiyon olup olmadığına bağlı olduğunu yazıyor . Üçüncü ve dördüncü noktalarda bunu yapar:

    Üçüncüsü, rastgele vektörler tam olarak dik olsaydı (aslında orijinal JL yapılarında olduğu gibi), o zaman JL projeksiyonunun dikey bir projeksiyon olması gerekirdi

    ...

    ancak bu Gaussyalılar, {±} rastgele değişkenler ve diğer birçok yapı için yanlış olsa da, sonuçta elde edilen vektörlerin yaklaşık birim uzunluğu ve yaklaşık dikey olduğu kanıtlanabilir.

    ...

    bu “yeterince iyi”.

    Böylece, prensip olarak, ortogonal matrislerle sınırlı olan farklı bir yapıya sahip rastgele projeksiyon yapabilirsiniz (buna rağmen). Örneğin orijinal esere bakın:

    Johnson, William B. ve Joram Lindenstrauss. "Lipschitz eşlemelerinin bir Hilbert uzaya genişletilmesi." Çağdaş matematik 26.189-206 (1984): 1.

    ... bir kişi rastgele seçerse, l n 2 üzerine sıralı bir k dikey projeksiyonl2n

    ...

    Bu kesin olmak için, izin S birinci üzerine projeksiyonu k koordinatları l2n ve izin σ ile Haar ölçü normalleştirilmiş Ö(n) , ilgili ortogonal grup l2n . Daha sonra rastgele değişken

    f:(Ö(n),σ)L(l2n)
    ile tanımlanan
    f(u)=USU
    "Rastgele rütbe k projeksiyonu " kavramını belirler .

    Vikipedi girişi rastgele projeksiyonu bu şekilde tarif eder (aynı şey sayfa 10 ve 11'deki ders notlarında da belirtilmiştir)

    https://en.wikipedia.org/wiki/Random_projection#Gaussian_random_projection

    Birinci sıra homojen seçilen rasgele birim vektör Sd-1 . İkinci sıra, ilk satıra dik olan uzaydan rastgele bir birim vektördür, üçüncü sıra ise ilk iki satıra dik olan uzaydan rastgele bir birim vektördür, vb.

    Ancak, matris içindeki tüm matris girişlerini normal dağılıma sahip rastgele ve bağımsız değişkenleri (Whuber'ın yorumunda çok basit bir sonuçla bahsettiği gibi) aldığınızda genellikle bu dikeyliği elde etmezsiniz "sütunlar her zaman dikey olsaydı, girişleri bağımsız olamaz ").

    Matris R, , bir projeksiyon matris ile ilgilidir, çünkü dik sütunları edilmesi durumunda ürün, bir çıkıntı olarak görülebilir P=R,TR, . Bu, normal en küçük kareler regresyonunu bir izdüşüm olarak görmekle biraz aynıdır. Ürün b=R,Tx çıkıntı değil ama bir farklı baz vektöründe koordinat verir. 'Gerçek' çıkıntının x'=R,b=R,TR,x ve yansıtma matrisi R,TR, .

    İzdüşüm matrisi P=R,TR, olması gerekmektedir kimlik belgesi alt uzay üzerinde U çıkıntının (bkz aralığıdır özelliklerini Ara sayfa sözü). Ya da farklı olarak, özdeşlik 1 ve 0'a sahip olması gerektiği söylenir, öyle ki özdeşlik matrisi olduğu altuzay, özdeğerler 1 ile ilişkili özvektörlerin aralığıdır. Rastgele matris girişleri ile bu özelliği elde edemezsiniz. Bu ders notlarındaki ikinci nokta

    ... birçok yönden dikey bir matrisi “benziyor”… rbirnge(PTP) eşit olarak dağıtılmış bir alt uzaydır ... ancak özdeğerler {0,1} .

    Not bu teklif matris bu P matris ile ilgilidir R, söz konusu olup izdüşüm matrisi için P=R,TR, matrisi tarafından ima edilmektedir R,

    Bu nedenle, matristeki rastgele girişlerin kullanılması gibi farklı konstrüksiyonların rastgele projeksiyonu, dik bir projeksiyona tam olarak eşit değildir. Ancak hesaplamalı olarak daha basittir ve Michael Mahoney'e göre, “yeterince iyi” dir.


1
Cevabınız için teşekkürler, sanırım yukarıda verdiğimle aynı yöne gidiyor. Sadece açıklığa kavuşturmak için, olduğunu belirtmelisiniz . Açıklayabilir olarak girdileri Sonra, R R d x k gelen iid N ( 0 , 1 ) , biz emin olamaz P 2 = P ya da P olarak öz sahiptir { 0 , 1 } . Tersine, eğer R sütunlarıP=R,R,TR,R,dxkN-(0,1)P2=PP{0,1}R,her iki koşul da yerine getirilir. Ama projeksiyon olduğunu belirtmek anahtarıdır , ve R yalnız! R,R,TR,
Daniel López

1
@ DanielLópez Güncelledim.
Sextus Empiricus

6

Bu doğru: "rastgele projeksiyon" kesinlikle bir projeksiyon değil.

Projeksiyon açık bir şekilde matematiksel bir nesne tanımlanır: https://en.wikipedia.org/wiki/Projection_(linear_algebra) - doğrusal bir idempotentent operatörü yani doğrusal operatörü P , öyle ki P2=P . Bir projeksiyonu iki kez uygulamak, onu yalnızca bir kez uygulamakla aynıdır, çünkü bir alt alana bir nokta yansıtıldıktan sonra, tekrar yansıtıldığında sadece orada kalmalıdır. Bu tanımda diklik hakkında hiçbir şey yoktur; aslında bir projeksiyon eğik olabilir (Wikipedia'ya bakınız).

Sadece kare matrislerin bu anlamda "projeksiyonları" temsil edebileceğini unutmayın. "Rastgele projeksiyon" k d ile rastgele bir dxk matrisi R, kullanır , bu nedenle yukarıdaki tanım anlamında bir projeksiyon olamaz.k«d

R, ortonormal sütunlarını yapsanız bile (örneğin Gram-Schmidt işlemini uygulayarak), bu argüman hala geçerli olacaktır. Birisi yakın zamanda PCA hakkında bu soruyu sordu: PCA bağlamında tam olarak "projeksiyon matrisi" ne denmelidir? - ortonormal özvektörlerin bir dxk matrisi U kesinlikle bir projeksiyon değil.


3
Son paragrafınızda, sütunların ortonormal olması durumunda, projeksiyonun doğrusal cebirdeki bir projeksiyon anlamında hala bir projeksiyon olmadığını söylersiniz. Ancak bunun nedeni, matrisin kare matris olmamasıdır. Bu, gösterimden ilke olarak daha fazladır. Matrisi sıfırlarla genişletirseniz, matris doğrusal bir izdüşümdür.
Sextus Empiricus

1
@MartijnWeterings Hayır, sanmıyorum. 2D alanı ve 1x2 olan ve şu şekilde görünen U alın: [sqrt (2) / 2, sqrt (2) / 2] (diyagonal projeksiyona karşılık gelir). Şimdi sıfırlarla uzatın. Kendisine eşit olmayacak.
amip

1
Başka bir şekilde genişletilmelidir, yapılabilir
kjetil b halvorsen

2
@amoeba, bunun kavramı / tanımı germe kabul, ama daha çok farkı olduğunu say e eşit değildir, bu ters terimi içeren I . Ortogonal vektörlerden yapıldığında doğrusal kombinasyon U , daha küçük bir alt uzaya ortogonal bir projeksiyona benzemektedir ve bu projeksiyonu aynı şekilde tekrarlayabilirsiniz. Sadece projeksiyon ile birlikte farklı bir dizi temel vektör seçilir (en azından biri nasıl görebilir) ve matris gösterimi P 2 = P gibi çalışmıyor , ancak geometrik olarak bir projeksiyona benziyor.R,(R,TR,)-1R,TbenUP2=P
Sextus Empiricus

2
Doğru, @MartijnWeterings, ancak dikey olmayan sütunları olan herhangi bir neden eğik bir çıkıntıya "benzemiyor" ? R,
amip

1

Buradaki anahtarın, dxk RP matris R sütun uzayını , izdüşümü gerçekleştirdiğimiz alt uzay olarak düşünmektir . Genel olarak, bağımsız olarak sütun olmadığı R ortogonal olan, tek bir örnek bir çıkıntı olabilir xRd sütun alan üzerine R, aşağıdaki denklem [1] Ussing:

p=xR,(R,TR,)-1R,TpR,d

R,R,TR,=benR,kxkxR,

p=xR,R,TpR,d

R,R,TR,dxd(R,R,T)2=R,R,TR,R,T=R,R,T

R,R,kR,dxR,dxR,R,TR,R,R,T

Burada akıl yürütmemi onaylayabilir / düzeltebilirseniz minnettar olurum.

Referans:

[1] http://www.dankalman.net/AUhome/classes/classesS17/linalg/projections.pdf


1
R(RTR)1RT

1
R,R,TR,

2
R,(R,TR,)-1R,T(R,TR,)-1R,TR,TR,Tβ=(R,TR,)-1R,Tyβy^=R,(R,TR,)-1R,Tyβ

-1

Hızlı Walsh Hadamard dönüşümünden önce yeniden hesaplanabilir rasgele işaret çevirme veya permütasyon kullanıyorsanız, rastgele projeksiyon diktir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.