Soru
Laplacian Eigenmaps yöntemiyle çok ilgileniyorum. Şu anda tıbbi veri setlerimde boyut küçültme yapmak için kullanıyorum.
Ancak, yöntemi kullanarak bir sorunla karşılaştım.
Örneğin, bazı verilerim (spektrum sinyalleri) var ve bazı PC'leri (veya IC'leri) almak için PCA (veya ICA) kullanabilirim. Sorun, LE kullanarak orijinal verilerin benzer boyutta küçültülmüş bileşenlerinin nasıl elde edilmesidir?
Laplacian eigenmaps yöntemine göre, genelleştirilmiş özdeğer problemini çözmemiz gerekiyor;
Burada özvektördür. Örneğin ilk 3 özvektörü (3 öz değerine göre çözelti) çizersem, sonuçlar yorumlanamaz.
Bununla birlikte, en iyi 3 PC ve en iyi 3 IC'yi çizdiğimde, sonuçlar her zaman açıkça (görsel olarak) orijinal verileri temsil ediyor gibi görünüyor .
Bunun nedeni, matrisinin ağırlık matrisi (Bitişiklik matrisi ) tarafından tanımlanmış olması ve verisinin üstel bir fonksiyon kullanan oluşturmak için ısı çekirdeği ile donatılmasıdır . Sorum nasıl azaltılabilir bileşenleri almak için ise (değil özvektörler matrisi içinde )?
Veri
Veri setim kısıtlı ve sorunu göstermek kolay değil. Burada ne demek istediğimi ve ne sormak istediğimi göstermek için bir oyuncak problemi yarattım.
Lütfen resme bakın,
İlk olarak, kırmızı eğrilerde (şeklin ilk sütunu) gösterilen bazı sinüs dalgaları A, B, C oluşturuyorum. A, B ve C, 1x1000 vektörde kaydedilmiş 1000 örneğe sahiptir.
İkinci olarak, rastgele oluşturulmuş doğrusal kombinasyonları kullanarak A, B, C kaynaklarını karıştırdım, örneğin, , burada rastgele değerlerdir. Karışık sinyal çok yüksek boyutlu , örneğin , 1517 rastgele seçilmiş yüksek boyutlu . Yeşil eğrilerde (şeklin ikinci sütunu) M sinyalinin sadece ilk üç sırasını gösteriyorum.
Sonra, boyut küçültme sonuçlarını almak için PCA, ICA ve Laplacian özma haritalarını çalıştırıyorum. Adil bir karşılaştırma yapmak için 3 PC, 3 IC ve 3 LE kullanmayı seçtim (mavi eğriler sırasıyla şeklin 3., 4. ve son sütunu olarak gösterildi).
PCA ve ICA sonuçlarından (şeklin 3., 4. sütunu), sonuçları bazı boyut küçültme olarak yorumlayabildiğimizi görebiliriz, yani ICA sonuçları için karışık sinyali ( PCA sonuçları ile de alabilir miyiz emin değilim ama sonuç benim için oldukça doğru görünüyor).
Ancak, lütfen LE sonuçlarına bakın, sonuçları zar zor yorumlayabiliyorum (şeklin son sütunu). İndirgenmiş bileşenlerle 'yanlış' bir şey gibi görünüyor. Ayrıca, sonunda son sütunun grafiğinin formülünde özvektör olduğunu belirtmek isterim
Daha fazla fikriniz var mı?
Isıtma çekirdeğinde en yakın 12 komşu ve sigma kullanan Şekil 1 0,5'tir:
Isıtma çekirdeğinde 1000'e yakın komşu ve sigma kullanan Şekil 2 0,5'tir:
Kaynak kodu : Gerekli pakete sahip Matlab kodu