Sıra korelasyonu ile kanonik korelasyon analizi


15

Kanonik korelasyon analizi (CCA), iki veri setinin lineer kombinasyonlarının normal Pearson ürün-moment korelasyonunu (yani doğrusal korelasyon katsayısı) maksimize etmeyi amaçlamaktadır.

Şimdi, bu korelasyon katsayısının sadece doğrusal ilişkileri ölçtüğünü düşünün - bu, örneğin, rastgele monoton (mutlaka zorunlu olmayan) ölçen Spearman- veya Kendall- (sıra) korelasyon katsayılarını da kullanmamızın sebebidir. değişkenler arasındaki bağlantı.ρτ

Bu nedenle, aşağıdakileri düşünüyordum: CCA'nın bir sınırlaması, sadece nesnel işlevi nedeniyle oluşan doğrusal kombinasyonlar arasındaki doğrusal ilişkiyi yakalamaya çalışmasıdır. O, diyelim ki, Spearman- maksimize ederek bir anlamda CCA uzatmak mümkün olmaz yerine Pearson- ?ρr

Bu prosedür istatistiksel olarak yorumlanabilir ve anlamlı bir şeye yol açar mı? (Örneğin - CCA'yı sıralamalarda gerçekleştirmek mantıklı mı?) Normal olmayan verilerle uğraşırken yardımcı olup olmayacağını merak ediyorum ...


4
Will OVERALS kanonik korelasyon maksimize etmek lineer kanonik analiz hangi optimal terazi (monotonik dönüşümleri) değişkenler - - beğeninize olmak?
ttnphns

@ttnphns: Fikir için teşekkürler, daha önce duymadım ve gerçekten ilginç görünüyor! Ancak, konuya hitap ettiğini düşünmüyorum: anladığım kadarıyla, bu en uygun ölçeklendirme ve CCA'nın bir kombinasyonudur - ancak optimal ölçeklendirme sadece kategorik değişkenler için gerçekten mantıklıdır. Oran ölçeğinde ölçülen sürekli değişkenler için çok fazla değişmiyor gibi görünüyor (ki bu benim aklımda!). Ama beni düzeltin, eğer yanılıyorsam.
Tamas Ferenci

1
@ttnphns: Bazen sürekli değişkenlerde Spearman korelasyonunu kullandığınız gibi! (Elbette verileri sıralı olarak ele alıyor ... ama yine de, değişkenler arasındaki genel monoton (ve sadece doğrusal değil) ilişkiyi karakterize etmek için kesinlikle sürekli değişkenler üzerinde kullanıyoruz.) Bu yüzden CCA içinde de anlamlı olacağını düşündüm. ...
Tamas Ferenci

@ Glen_b, Haklısın. Elbette sıra korelasyonları sıralı veya sürekli veri olsun, herhangi bir monotonluk içindir. Yukarıdaki yorumumda o kadar çok şaşırdım ki onu sildim.
ttnphns

Özellikle radyal temelli işlevlerle kullanıldığında verileri sonsuz boyutlu bir alt alana yansıtmamızı sağlayan Çekirdek CCA'yı kullanmayı deneyebilirsiniz.
roni

Yanıtlar:


6

Kanonik değişkenleri hesaplarken kısıtlı kübik spline açılımları kullandım. Analize, yeni özellikler eklediğiniz gibi doğrusal olmayan temel işlevler ekliyorsunuz. Bu doğrusal olmayan ana bileşen analiziyle sonuçlanır. R Bkz Hmiscpaket 'in transcanbir örnek için bir işlev. R homalspaketi bunu daha da ileri götürüyor.


1
Teşekkür ederim! Homellerde anlatılan yaklaşım benim için yeni ama kesinlikle ilginçti.
Tamas Ferenci

4

CCA'nın standart yöntemi, ürün moment korelasyon katsayı matrisi ile çalışır. En büyük mgnitude CC için, abs (korelasyon (z1, z2)) maksimize edilecek şekilde iki matixin (n satır ve m1 ve m2 değişkenleriyle) lineer kombinasyonuyla z1 (n) ve z2 (n) iki bileşik değişkeni oluşturur. Bu objektif fonksiyon, korelasyon (z1, z2) ürün momenti olmasa da farklı tanımlanmış olsa bile doğrudan maksimize edilebilir.

Mishra, SK (2009) "İki Sıralama Puanının Sıralı Kanonik Korelasyon Analizi Üzerine Bir Not"

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.