Kosinüs benzerliği doğrusal bir dönüşümden sonra nasıl değişir?


9

Arasında matematiksel bir ilişki var mı:

  • iki ve vektörünün kosinüs benzerliği vesim(A,B)AB
  • ve kosinüs benzerliği , belirli bir matrisi aracılığıyla eşit olmayan bir şekilde ölçeklendirilmiş mi? Burada , diyagonal üzerinde eşit olmayan elemanlara sahip verilen bir diyagonal matristir.sim(MA,MB)ABMM

Hesaplamaları gözden geçirmeye çalıştım, ancak basit / ilginç bir bağlantıya (ifade) ulaşamadım. Acaba biri var mı?


Örneğin, açılar düzgün olmayan ölçeklemede korunmaz, ancak orijinal açılar ile düzgün olmayan ölçeklemeden sonraki açılar arasındaki ilişki nedir? Bir dizi S1 vektörü ve başka bir S2 vektörleri kümesi arasındaki bağlantı hakkında ne söylenebilir - burada S2 eşit olmayan bir şekilde ölçeklendirilen S1 ile elde edilir?


@whuber, teşekkür ederim! Evet, M belirli bir matristir (bir ölçeklendirme matrisi - dolayısıyla çapraz bir matris, başka kısıtlama yok). Bir anlamda, doğrusal olmayan bir ölçeklendirme yaşayan bir vektör uzayına (herhangi bir vektör çifti için kosinüs benzerliği açısından) ne olduğunu bilmek istedim.
turdus-merula

2
Tüm ölçek faktörleri negatif değilse (doğal olarak varsayıldığı gibi), o zaman tüm simetrik pozitif tanımlı matrislerin "ölçekleme" matrisleri olarak kabul edilebileceğini belirtmek gerekir. Aradığınız ilişki, diğer şeylerin yanı sıra , harita projeksiyonlarındaki çarpıklığın araştırılmasında ve tanımlanmasında yaygın olarak kullanılmaktadır . Burada, dünya yüzeyinde , haritada iki dikey yön ile ilişkilendirilecek maksimum ve minimum açılardaki ilgi merkezleri . Bu açılarla iki ölçek faktörünün oranları arasında doğrudan bir ilişki vardır.
whuber

Yanıtlar:


8

Çünkü oldukça genel ve kosinüs benzerlik değişim özellikle bağlıdır ve ve ilişkileri , kesin bir formül mümkündür. Bununla birlikte, kosinüs benzerliğinin ne kadar değişebileceği konusunda pratik olarak hesaplanabilir sınırlar vardır . ve arasındaki kosinüs benzerliğinin , örneğin (burada , ve arasındaki açıdır belirtilen bir değer olduğu göz önüne alındığında, ve arasındaki açının ekstrüze edilmesiyle bulunabilir . Cevap bize herhangi bir açının ne kadar olduğunu söylerMABMMAMBABcos(2ϕ)2ϕAB2ϕmuhtemelen dönüşümüyle bükülebilir .M

Hesaplamalar dağınık olmakla tehdit ediyor. Bazı zekice gösterim seçenekleri, bazı ön basitleştirmelerle birlikte, çabayı azaltır. O çıkıyor iki boyutta çözüm bilmemiz gereken her şeyi ortaya koymaktadır. Bu yalnızca bir tane gerçek değişken olarak bir uysal problem, kolaylıkla Analiz teknikleri kullanılarak çözülmektedir. Basit bir geometrik argüman bu çözümü boyutlarına kadar genişletir .θn

Matematiksel ön bilgiler

Tanım olarak, herhangi bir ve vektörü arasındaki açının kosinüsü, bunların birim uzunluğuna normalleştirilmesi ve ürünlerinin alınmasıyla elde edilir. Böylece,AB

AB(AA)(BB)=cos(2ϕ)

ve, yazma , görüntüleri arasındaki açının kosinüs ve dönüşüm altında olduğuΣ=MMABM

(1)(MA)(MB)((MA)(MA))((MB)(MB))=AΣB(AΣA)(BΣB).

Analizde sadece önemli olduğuna dikkat edin,Σ kendisi değil . Bu nedenle istismar edebilir tekil değer ayrışımı (SVD) ait sorunu basitleştirmek için. Bunun dikey bir matrisi , köşegen bir matrisi ve başka bir dikey matris bir ürünü olarak (sağdan sola) ifade ettiğini hatırlayın :MMMVDU

M=UDV.

Diğer bir deyişle, ayrıcalıklı vektörlerin bir taban vardır (sütunları üzerinde) , her yeniden ölçeklendirilmesi ile hareket ayrı ayrı diyagonal giriş (I arayacak ) ve daha sonra bir rotasyon (veya rotasyon karşıtı) uygulanması. Bu son dönüş herhangi bir uzunluğu veya açıyı değiştirmeyecektir ve bu nedenle etkilememelidir . Bunu resmi olarak hesaplama ile görebilirsiniz.e1,,enVMeiithDdiUΣ

Σ=MM=(UDV)(UDV)=VD(UU)DV=VD2V.

Sonuç olarak, incelemek için de aynı değerleri üreten herhangi bir matrisle serbestçe değiştirebiliriz . Sipariş ederek böylece boyut (ve varsayarak azalma özdeş sıfır değildir), güzel bir seçim iseΣM(1)eidiMM

M=1d1DV.

nin köşegen öğeleri şunlardır:(1/d1)D

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

Özellikle, (orijinal veya değiştirilmiş formunda) tüm açılar üzerindeki etkisi tamamenM

Mei=λiei.

Özel bir vakanın analizi

Let . Vektörlerin uzunluklarının değiştirilmesi aralarındaki açıyı değiştirmediğinden, ve birim vektörler olduğunu varsayabiliriz . Düzlemde, tüm bu vektörler ile yaptıkları açı ile ve izin verirn=2ABe1

A=cos(θϕ)e1+sin(θϕ)e2.

bu nedenle

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(Aşağıdaki şekle bakın.)

uygulanması basittir: ve ilk koordinatlarını sabitler ve ikinci koordinatlarını . Bu nedenle gelen açı için olduğunuMABλ2MAMB

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

Çünkü sürekli bir fonksiyonudur, bu açıların, bu fark, sürekli bir fonksiyondur . Aslında, farklılaşabilir. Bu, türevinin sıfırlarını inceleyerek uç açıları bulmamızı sağlar . Bu türev hesaplamak kolaydır: trigonometrik fonksiyonların bir oranıdır. Sıfırlar yalnızca payının sıfırları arasında gerçekleşebilir, bu yüzden paydayı hesaplama zahmetine girmeyelim. Elde ederizMθf(θ)

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

, ve özel durumları kolayca anlaşılır: düşük sıralı olduğu durumlara karşılık gelir (ve böylece tüm vektörleri bir satıra sıkıştırır); burada , kimlik matrisinin bir katıdır; ve burada ve paraleldir (bu nedenle aralarındaki açı ne olursa olsun değişemez ). Durumda durum engellemediği .λ2=0λ2=1ϕ=0MMABθλ2=1λ20

Bu özel durumlar dışında, sıfırlar yalnızca : yani veya . Bu, tarafından belirlenen çizginin açısını ikiye anlamına gelir . Artık ve arasındaki açının aşırı değerlerinin değerleri arasında olması gerektiğini biliyoruz , bu yüzden bunları hesaplayalım:sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)

f(0)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

Karşılık gelen kosinüsler

(2)cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2

ve

(3)cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.

Genellikle dik açıları nasıl bozduğunu anlamak yeterlidir . Bu durumda, önceki formüllere ekleyebileceğiniz yol açan .M2ϕ=π/2tan(ϕ)=cot(ϕ)=1

ne kadar küçük , bu açılar o kadar aşırı olur ve bozulma o kadar büyük olur.λ2

Dört yapılandırmayı gösteren şekil

Bu şekil, açısıyla ayrılmış ve vektörlerinin dört konfigürasyonunu göstermektedir . Birim çemberi ve altındaki eliptik görüntüsü referans için gölgelendirilmiştir ( hareketi olacak şekilde eşit olarak yeniden ölçeklendirilmiştir ). Şekil başlıkları değerini , ve orta noktasını gösterir . ile dönüştürüldüğünde böyle bir ve en yakın gelebilir ile soldakine benzer bir yapılandırmaAB2ϕ=π/3MMλ1=1θABABMθ=0. En uzak olmaları, ile sağdaki gibi bir yapılandırmadır . İki ara olasılık gösterilmiştir.θ=π/2

Tüm boyutlar için çözüm

her bir boyutu bir faktör genişleterek nasıl . Bu, birim küresini elipsoide çarpıtır . onun ana eksenleri belirler. elipsoide, bu eksenler boyunca, kökeni gelen mesafeler vardır. Sonuç olarak, en küçük olan , başlangıç ​​noktasından elipsoide en kısa mesafedir (herhangi bir yönde) ve en büyük uzaklık , , başlangıç ​​noktasından elipsoide en uzak mesafedir (herhangi bir yönde).Miλi{A|AA=1}eiλiλnλ1

Daha yüksek boyutlarda , ve iki boyutlu bir altuzayın parçasıdır. , bu alt uzaydaki birim daireyi, ve içeren bir düzlemle elipsoidin kesişimine eşler . Bir dairenin doğrusal bir bozulması olan bu kavşak bir elipstir. Açıkçası, bu elipse olan en uzak mesafe fazla değildir ve en kısa mesafe az değildir .n>2ABMMAMBλ1=1λn

Nitekim, önceki bölümde sonunda gözlemlenen zamanda zaman, en uç olasılık ve iki içeren bir düzlem içinde yer alır olan karşılık gelen oranı mümkün olduğu kadar küçük olduğu gibi. Bu düzleminde olacak. Bu dava için zaten bir çözümümüz var.ABeiλie1,en

Sonuçlar

Uygulayarak kosinüs benzerliği, mümkün olan uç sahip olan iki vektörlere kosinüs benzerliği tarafından verilmiştir ve . Bunlar yerleştirerek tarafından elde edilmektedir ve bir yöne eşit açılarda maksimum (örneğin bir vektör uzatır yönü) ve bir yönde bunları ayıran (minimal bir vektör uzatır gibi ) yönünde.Mcos(2ϕ)(2)(3)ABΣ=MMe1Σen

Bu aşırılıklar SVD'si olarak hesaplanabilir .M


Bu harika bir cevap! Bu ayrıntılı tartışma için çok teşekkür ederim! Sadece genel bir eksi işareti olması gereken eqn (3) 'de bir işaret hatası olduğuna inanıyorum.
LFH

açısının sıfıra yaklaştığı durumla ilgileniyorum ve ve arasında bir eşitsizlik elde etmek istiyorum . Hesaplamanıza dayanarak, sadece en uç (en küçük) ve bu durumda asimptotik eşitsizliğin olarak ? 2ϕ2ϕfλn2λnϕf2λn1ϕϕ0
LFH

6

Muhtemelen ilginizi çekiyor:

(MA,MB)=AT(MTM)B,

Bu köşegenleştirebiliriz (veya millet, PCA çağrı gibi), bu benzerliği anlatır, dönüşüm altında çıkıntı hareket etmektedir daha sonra da temel bileşenler üzerine ve bu yeni alanda benzerlik hesaplanıyor. Bunu biraz daha fazla ifade etmek için, temel bileşenlerin özdeğerleri ile olmasına izin . SonraMTM=UΣUTA,BMA,Buiλi

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

hangi size verir:

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

Burada bir ölçekleme olduğuna dikkat edin: / küçülüyor. Tüm birim vektörleri ve her ise , o zaman olsun bir dönüşüne karşılık gelir, ve: , ki iç ürünlerin rotasyon altında değişmez olduğunu söylemeye eşdeğerdir. Genel olarak, açı kalır aynı zaman , bu durumda gerektiren bir uygun dönüşüm olduğunu tersinirdir ve polar ayrışma tatmin ile , yani .λiA,Bλi=1Msim(MA,MB)=sim(A,B)MMMM=OPP=aIMTM=a2I


1
Sorunun ilk ifadesi , kosinüs benzerliğini hesaplamak için gerekli olan , , ve vektörlerinin normalleştirilmesini ihmal eder . Sonraki analizin de bu normalleşmeye yönelik olduğu görülmemektedir. Özellikle, tüm özdeğerler farklı (pozitif) bir değere eşit olsa bile kosinüs benzerliklerinin korunduğuna dikkat edin . Bu, bu basit durumda bile, çok daha fazlasının söylenebileceğini gösterir. ABMAMB1
whuber

@whuber: tam olarak ne zaman kosinüs benzerliği korunur bu durumda gerektiren denk bir uygun dönüşüm olduğunu ters çevrilebilir olması ve kimlik katı olmalıdır. Başka bir yolla, polar ayrışması tatmin eder , burada . Normalleştirme konusunda haklısınız, ancak normalleştirilmemiş vektörleri ile kosinüs benzerliği hakkında konuşmak aptalca görünüyor . MMMTM=a2IMM=OPP=aIA,B
Alex

2
Hiç saçma değil! Bu "benzerlik" vektörler arasındaki açının kosinüsü tarafından verildiğinden, sıfır olmayan iki vektör için mantıklıdır. Ne "çok daha söylenebilir" demek görüntüleri arasındaki açıya o etkili sınırları olan ve arasındaki açı cinsinden elde edilebilir ve ve öz değerlerine . ABABM
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.