Bu korelasyon tabanlı mesafeler için üçgen eşitsizliği sağlanmış mı?


13

Hiyerarşik kümeleme için, iki rastgele değişken ve arasındaki mesafeyi ölçmek için genellikle aşağıdaki iki "metriği" (tam olarak konuşmuyorlar) görüyorum : \ newcommand {\ Cor} {\ mathrm {Cor}} \ begin {align} d_1 (X, Y) = 1- | \ Kor (X, Y) |, \\ d_2 (X, Y) = 1 - (\ Kor (X, Y)) ^ 2 \ ucu {hizalamak} ya da mu üçgen eşitsizliğini nasıl karşılar? Öyleyse, sadece kaba kuvvet hesaplaması dışında bunu nasıl kanıtlamalıyım? Metrik değilse, basit bir karşı örnek nedir?XY

d1(X,Y)=1|Cor(X,Y)|,d2(X,Y)=1(Cor(X,Y))2

Bu makaleyi incelemek isteyebilirsiniz: arxiv.org/pdf/1208.3145.pdf .
Chris

Yanıtlar:


5

Üçgen eşitsizliği senin üzerinde doğuracak: d1

d1(X,Z)d1(X,Y)+d1(Y,Z)1|Cor(X,Z)|1|Cor(X,Y)|+1|Cor(Y,Z)||Cor(X,Y)|+|Cor(Y,Z)|1+|Cor(X,Z)|

Bu yenmek için oldukça kolay bir eşitsizlik gibi görünüyor. ve bağımsız hale getirerek sağ tarafı mümkün olduğunca küçük (tam olarak bir) yapabiliriz . O zaman sol tarafın birini aştığı bir bulabilir miyiz ?Z YXZY

Eğer ve ve , daha sonra aynı varyans ve benzer için , yani sol taraf birin üzerindedir ve eşitsizlik ihlal edilir. ve çok değişkenli bir normalin bileşenleri olduğu R'deki bu ihlale örnek :X Z C o r ( X , Y ) = Y=X+ZXZCor(Y,Z)XZCor(X,Y)=220.707Cor(Y,Z)XZ

library(MASS)
set.seed(123)
d1 <- function(a,b) {1 - abs(cor(a,b))}

Sigma    <- matrix(c(1,0,0,1), nrow=2) # covariance matrix of X and Z
matrixXZ <- mvrnorm(n=1e3, mu=c(0,0), Sigma=Sigma, empirical=TRUE)
X <- matrixXZ[,1] # mean 0, variance 1
Z <- matrixXZ[,2] # mean 0, variance 1
cor(X,Z) # nearly zero
Y <- X + Z

d1(X,Y) 
# 0.2928932
d1(Y,Z)
# 0.2928932
d1(X,Z)
# 1
d1(X,Z) <= d1(X,Y) + d1(Y,Z)
# FALSE

Bu yapının çalışmadığına dikkat edin :d2

d2 <- function(a,b) {1 - cor(a,b)^2}
d2(X,Y) 
# 0.5
d2(Y,Z)
# 0.5
d2(X,Z)
# 1
d2(X,Z) <= d2(X,Y) + d2(Y,Z)
# TRUE

üzerine teorik bir saldırı başlatmak yerine , bu aşamada güzel bir karşı örnek ortaya çıkana kadar R'deki kovaryans matrisi ile oynamayı daha kolay buldum . İzin , ve verir:V a r ( X ) = 2 V a r ( Z ) = 1 C o v ( X , Z ) = 1d2SigmaVar(X)=2Var(Z)=1Cov(X,Z)=1

Var(Y)=Var(X+Y)=Var(X)+Var(Z)+2Cov(X,Z)=2+1+2=5

Kovaryansları da araştırabiliriz:

C o v ( Y , Z ) = C o v ( X + Z , Z

Cov(X,Y)=Cov(X,X+Z)=Cov(X,X)+Cov(X,Z)=2+1=3
Cov(Y,Z)=Cov(X+Z,Z)=Cov(X,Z)+Cov(Z,Z)=1+1=2

Kareli korelasyonlar şu şekilde olur: Cor(X,Y)2=Cov(X,Y)2

Cor(X,Z)2=Cov(X,Z)2Var(X)Var(Z)=122×1=0.5
Cor(Y,Z)2=Cov(Y,Z)2
Cor(X,Y)2=Cov(X,Y)2Var(X)Var(Y)=322×5=0.9
Cor(Y,Z)2=Cov(Y,Z)2Var(Y)Var(Z)=225×1=0.8

Sonra iken ve böylece üçgen eşitsizliği önemli bir farkla ihlal edilir.d 2 ( X , Y ) = 0,1 d 2 ( Y , Z ) = 0,2d2(X,Z)=0.5d2(X,Y)=0.1d2(Y,Z)=0.2

Sigma    <- matrix(c(2,1,1,1), nrow=2) # covariance matrix of X and Z
matrixXZ <- mvrnorm(n=1e3, mu=c(0,0), Sigma=Sigma, empirical=TRUE)
X <- matrixXZ[,1] # mean 0, variance 2
Z <- matrixXZ[,2] # mean 0, variance 1
cor(X,Z) # 0.707
Y  <- X + Z
d2 <- function(a,b) {1 - cor(a,b)^2}
d2(X,Y) 
# 0.1
d2(Y,Z)
# 0.2
d2(X,Z)
# 0.5
d2(X,Z) <= d2(X,Y) + d2(Y,Z)
# FALSE

5

Bize üç vektörleri var edelim (bu değişkenler veya bireyler olabilir) , ve . Ve her birini z skorlarına standardize ettik (ortalama = 0, varyans = 1).Y ZXYZ

Daha sonra kosinüs teoremine (" kosinüs kanunu") göre iki standart vektör (örneğin X ve Y) arasındaki kareli öklid mesafesi , burada , kosinüs benzerlik, bir Pearson bağlı vektörlerin z standardizasyona. sabit çarpanı güvenli bir şekilde göz ardı edebiliriz .dXY2=2(n1)(1cosXY)cosXYrXY2(n1)

Böylece, sorudaformül korelasyon katsayısının işaretini göz ardı etmiyorsa, kareli öklid mesafesi olacaktır.d1(X,Y)=1|Cor(X,Y)|

matrisi ise s gram (pozitif semidefinite) olur, o zaman "d1" mesafesinin karekökü, metrik olan öklid mesafedir. Büyük değilmesafelerin öklid uzayında iyi yakınsamaktan uzak olmadığı, genellikle bir durumdur. Metrik öklidinden daha geniş bir sınıf olduğundan, belirli bir "sqrt (d1)" mesafe matrisi oldukça sık metrik görünmeyi bekleyebilir.|r||r|

"Ö" kareli öklid mesafesi olan "d1" e göre, kesinlikle metrik değildir. Gerçek kare öklid mesafesi bile metrik değildir: bazen üçgen eşitsizliği ilkesini ihlal eder. [Küme analizinde, kareli öklid mesafesi oldukça sık kullanılır; bununla birlikte, bu gibi vakaların çoğu gerçekte analizleri eşsiz bir uzaklık üzerine inşa eder, kare olanlar hesaplamalar için sadece uygun bir girdidir.] Bunu görmek için (kare öklid ), üç vektörümüzü çizelim.d

resim açıklamasını buraya girin

Vektörler birim uzunluktadır (çünkü standartlaştırılmıştır). Açıların ( , , ) sırasıyla , , 'dır. Bu açılar, vektörler arasında karşılık gelen öklid mesafelerini yayar: , , . Basitlik için, üç vektörün hepsi aynı düzlemdedir (ve bu nedenle ve arasındaki açı diğer iki toplamıdır ). Kare uzaklıktaki üçgen eşitsizliğinin ihlalinin en belirgin olduğu konumdur .αβα+βrXYrXZrYZdXYdXZdYZXZα+β

Çünkü, gözlerle görebileceğiniz gibi, yeşil kare alan iki kırmızı karenin toplamını mükemmelleştirir: .dYZ2>dXY2+dXZ2

Bu nedenle

d1(X,Y)=1|Cor(X,Y)|

metrik olmadığını söyleyebiliriz. Çünkü tüm başlangıçta pozitif olsa bile , mesafe metrik olmayan öklidyen .rd2

İkinci mesafe ne olacak?

d2(X,Y)=1(Cor(X,Y))2

Korelasyon yana standart vektörler durumunda olduğu , olduğu . (Aslında, olduğu bir şey ile bağımlı değişken karesi korelasyon olan bir miktar, bir doğrusal regresyon ortogonal öngörücüsü.) Bu durumda, bunları kare vektörlerin sinüslerle çizmek ve olun (çünkü biz olan mesafeden bahsediyorsunuz ):rcos1r2sin21r2SSerror/SStotalsin2

resim açıklamasını buraya girin

Görsel olarak açık olmasa da, yeşil karesi yine kırmızı alanların toplamından daha büyük .sinYZ2sinXY2+sinXZ2

Bu kanıtlanabilirdi. Bir uçakta . ile ilgilendiğimiz için her iki tarafı da kare yapın .sin(α+β)=sinαcosβ+cosαsinβsin2

sin2(α+β)=sin2α(1sin2β)+(1sin2α)sin2β+2sinαcosβcosαsinβ=sin2α+sin2β2[sin2αsin2β]+2[sinαcosαsinβcosβ]

Son ifadede, iki önemli terim parantez içinde gösterilmiştir. Eğer ikisinden ikincisi birincisinden daha büyükse (veya olabilir) o zaman ve "d2" mesafesi ihlal edilir üçgen eşitsizliği. Ve yaklaşık 40 derece ve yaklaşık 30 derecedir (1. terim ve 2. terim ). "D2" metrik değil.α βsin2(α+β)>sin2α+sin2βαβ.1033.2132

"D2" mesafesinin kare kökü - sinüs farklılığı ölçüsü - yine de metriktir (inanıyorum). Emin olmak için çevremdeki çeşitli ve açılarıyla oynayabilirsiniz . "D2" nin, doğrusal olmayan bir ortamda metrik olduğunu gösterip göstermeyeceği (yani, bir düzlemde olmayan üç vektör) - Şimdilik söyleyemem, ancak geçici olarak olacağını varsayıyorum.βαβ


3

Ayrıca yazdığım bu ön baskıya da bakın: http://arxiv.org/abs/1208.3145 . Hala zaman ayırmam ve doğru şekilde göndermem gerekiyor. Soyut:

Metrik koruyucu fonksiyonların basit aracını kullanarak, kosinüs benzerliğinin iki dönüşüm sınıfını ve Pearson ve Spearman korelasyonlarını metrik mesafelere araştırıyoruz. Birinci sınıf, anti-korelasyonlu nesneleri en üst düzeye çıkarır. Daha önce bilinen dönüşümler bu sınıfın içindedir. İkinci sınıf, ilişkili ve anti-korelasyonlu nesneleri harmanlar. Metrik mesafe veren böyle bir dönüşüm örneği, ortalanmış verilere uygulandığında sinüs fonksiyonudur.

Sorunuzun sonucu, d1 , d2'nin gerçekten metrik olmaması ve d2'nin kare kökünün aslında uygun bir metrik olmasıdır.


2

Hayır.

En basit karşı örnek:

için mesafesi senin ne olursa olsun, hiç tanımlanmadı olduğunu.YX=(0,0)Y

Herhangi bir sabit seri standart sapmaya ve bu nedenle tanımında sıfıra bölünmeye neden olur ...C o rσ=0Cor

En çok, veri serisinin bir alt kümesindeki, herhangi bir sabit seri içermeyen bir metriktir.


İyi bir nokta! Başka bir yerde bahsedilen ön baskıda bundan bahsetmeliyim.
mikans
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.