İki özdeş veri kümesi arasındaki CCA, bu veri kümesindeki PCA'ya eşdeğer midir?


10

Okuma Ara iki rasgele vektörler için kanonik korelasyon analizi ile ilgili (CCA) ve , bir ana bileşen anslysis (PCA) CCA aynı olup olmadığını merak X = Y ?XYX=Y


Lütfen daha açık bir şekilde ifade edin: 1) vectors X and Yİki değişken (veri sütunları) veya iki durum (satırlar); değişkenlerin analizini yapacağız. 2) X and Y are the sameX = Y veya başka bir yolla mı söylemek istediniz?
ttnphns

@ttnphns: 1) X ve Y iki rastgele vektördür. İki rasgele değişken vektörü, iki veri sütunu kümesi, iki durum (satır) değil. 2) X=Y .
Tim

Her set tek bir değişkenden oluşuyorsa, aralarında tam olarak Pearson r olan bir kanonik korelasyon vardır ; ve CCA, X'in Y ile lineer regresyonu haline gelir ya da tam tersi olur. Bu r'nin PCA ile ayrıştırılması biraz başka bir hikaye. PCA ve CCA farklı analizlerdir.
ttnphns

Merhaba, @Tim, cevabımın yararlı olup olmadığını veya başka sorularınız olup olmadığını merak ediyorum? Eğer öyleyse, açıklığa kavuşturmaktan mutluluk duyarım.
amip

@amoeba: Evet, öyle. Şu anda başka sorum yok ve cevabınızı daha sonra okuyacağım. Cevabınız için teşekkürler. + 1
Tim

Yanıtlar:


7

Let olmak ve olacak ile iki veri temsil veri matrisi örnekleri (Random satır vektörlerinin yani gözlemler ve her biri olarak).Xn×p1Yn×p2nXY

Lineer bir kombinasyonu CCA görünüm değişken ve lineer bir kombinasyonu değişken bunlar maksimum aralarında ilişkili olduğu gibi; daha sonra birinci çiftle sıfır korelasyon kısıtlaması altında bir sonraki çifti arar; vb.p1Xp2Y

Durumda (ve ), bir veri kümesi içinde herhangi bir doğrusal kombinasyonunun trivially korelasyon olacak bir veri kümesi de aynı doğrusal bir kombinasyonu ile. Böylece tüm CCA çiftlerinin korelasyonları olacaktır ve çiftlerin sırası keyfidir. Geriye kalan tek kısıt, lineer kombinasyonların birbirleri arasında korelasyon olmaması gerektiğidir. ilişkisiz doğrusal kombinasyonları seçmek için sonsuz sayıda yol vardır (ağırlıkların -boyutlu uzayda dik olması gerekmediğine dikkat edin ) ve bunların herhangi biri geçerli bir CCA çözümü üretecektir. Böyle bir yol gerçekten PCA tarafından verilir, çünkü herhangi iki PC'nin korelasyonu sıfırdır.X=Yp1=p2=p11pp

Dolayısıyla PCA çözümü gerçekten geçerli bir CCA çözümü olacaktır, ancak bu durumda sonsuz sayıda eşdeğer derecede iyi CCA çözümü vardır.


Matematiksel olarak, CCA sağ ( ) ve sol ( ) tekil vektörlerini arar , ki bu durumda eşittir , herhangi bir vektör bir özvektördür. Bu yüzden isteğe bağlı olabilir. CCA daha sonra ve olarak doğrusal kombinasyon ağırlıklarını elde eder . Bu durumda, keyfi bir temel alarak ve gerçekten ilişkisiz yönler üretecek olan ile dönüştürülür .abCXX1/2CXYCYY1/2Ia=bCXX1/2aCYY1/2bCXX1/2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.