Varsa çekirdeğin PCA ben doğrusal çekirdek seçim , sonuç farklı olacak Sıradan doğrusal PCA ? Çözümler temelde farklı mı veya iyi tanımlanmış bir ilişki var mı?
Varsa çekirdeğin PCA ben doğrusal çekirdek seçim , sonuç farklı olacak Sıradan doğrusal PCA ? Çözümler temelde farklı mı veya iyi tanımlanmış bir ilişki var mı?
Yanıtlar:
Özet: Doğrusal çekirdekli çekirdek PCA, standart PCA ile tam olarak eşdeğerdir.
, sütunlarda D değişkenleri ve satırlardaki N veri noktaları ile N × D boyutunun ortalanmış veri matrisi olsun . Daha sonra D x D kovaryans matrisi X ⊤ X / ( n - 1 ) ile verilir , özvektörleri temel eksenler ve özdeğerler PC varyanslarıdır. Aynı zamanda, N × N boyutunda Gram matrisi X X ⊤ olarak adlandırılabilir . N - 1'e kadar aynı özdeğerlere (yani PC varyanslarına) sahip olduğunu görmek kolaydır. faktör ve özvektörleri birim normlara göre ölçeklendirilmiş temel bileşenlerdir.
Bu standart PCA idi. Şimdi, çekirdek PCA'da, her veri noktasını, genellikle daha büyük boyutta D n e w , muhtemelen sonsuz olan başka bir vektör uzayına eşleyen bazı fonksiyonunu ele alıyoruz . Çekirdek PCA fikri, bu yeni alanda standart PCA'yı gerçekleştirmek.
Bu yeni uzayın boyutsallığı çok büyük (veya sonsuz) olduğundan, bir kovaryans matrisi hesaplamak zor veya imkansızdır. Ancak, yukarıda açıklanan PCA'ya ikinci yaklaşımı uygulayabiliriz. Aslında, Gram matrisi hala aynı yönetilebilir boyutunda olacaktır. Bu matrisin elemanları tarafından verilmektedir cp ( x i ) φ ( x j ) , dediğimiz olan çekirdek fonksiyonu K ( X i , x j ) = φ ( x i ) φ ( x j ). Çekirdek hilesi olarak bilinen şey budur : kişinin aslında hesaplaması gerekmez , sadece K ( ) . Bu Gram matrisinin özvektörleri, ilgilendiklerimiz olan hedef uzaydaki temel bileşenler olacaktır.
Sorunuzun cevabı şimdi belli oluyor. Eğer , sonra çekirdek gram matris azaltır x x ⊤ , standart Gram matris eşit olan, ve bu nedenle temel bileşenler değiştirmeyecektir.
Çok okunabilir bir referans, Scholkopf B, Smola A ve Müller KR, Çekirdek ana bileşen analizi, 1999'dur ve örneğin Şekil 1'de standart PCA'yı açıkça bir çekirdek işlevi olarak nokta ürünü kullanan olarak ifade ettiklerine dikkat edin:
aynı sol tekil vektörlere ve dolayısıyla aynı temel bileşenlere sahiptir.
Bana öyle geliyor ki, doğrusal çekirdekli bir KPCA, basit PCA ile aynı olmalıdır.
Özdeğerleri alacağınız kovaryans matrisi aynıdır:
You can check with more details here.