PCA hakkında birkaç ders önce sınıfta öğrendim ve bu büyüleyici konsept hakkında daha fazla şey kazarak, seyrek PCA hakkında bilgi sahibi oldum.
Sormak istedim, yanlış değilsem, PCA'nın seyrek olduğu şey budur: PCA'da, değişkenli veri noktalarınız varsa, PCA'yı uygulamadan önce her veri noktasını boyutlu alanda temsil edebilirsiniz . PCA'yı uyguladıktan sonra, tekrar aynı boyutsal alanda temsil edebilirsiniz, ancak bu kez, ilk ana bileşen en fazla varyansı, ikincisi en fazla ikinci varyans yönünü ve benzerlerini içerecektir. Böylece, son birkaç ana bileşeni ortadan kaldırabilirsiniz, çünkü bunlar çok fazla veri kaybına neden olmaz ve verileri sıkıştırabilirsiniz. Sağ?
Seyrek PCA, bu bileşenlerin vektör katsayılarında sıfır olmayan değerleri içerecek şekilde ana bileşenleri seçmektedir.
Bunun, verileri daha iyi yorumlamanıza nasıl yardımcı olması gerekir? Birisi bir örnek verebilir mi?