Temel bileşen analizi (PCA) yapmak için, her bir sütunun ortalamalarını verilerden çıkarmanız, korelasyon katsayı matrisini hesaplamanız ve sonra özvektörleri ve özdeğerleri bulmanız gerekir. Daha doğrusu, Python'da uygulamak için yaptığım şey, sadece korelasyon katsayısı matrisini (corrcoef) bulma yöntemi yüksek boyutsallığa sahip bir dizi kullanmama izin vermediği için sadece küçük matrislerle çalışıyor. Görüntüler için kullanmam gerektiğinden, mevcut uygulamam bana gerçekten yardımcı olmuyor.
Veri matrisi nizi almanın ve yerine hesaplamanın mümkün olduğunu okudum , ama bu benim için çalışmıyor. Ne anlama geldiğimi tam olarak bilmiyorum, bunun yanında yerine matrisi olması gerekiyor (benim durumumda ). Özyüz derslerinde olanlar hakkında okudum ama hiçbiri bunu gerçekten anlayabileceğim şekilde açıklamıyordu.D D ⊤ / n D ⊤ D / np × p p ≫ n
Kısacası, takip edebilmem için bu yöntemin basit bir algoritmik açıklaması var mı?