PCA hakkında birkaç hızlı sorum var:
- PCA , veri kümesinin Gauss olduğunu varsayıyor mu?
- Doğası gereği doğrusal olmayan verilere bir PCA uyguladığımda ne olur?
Bir veri kümesi verildiğinde, işlem ilk önce normalleştirmek, varyansı 1'e ayarlamak, bir SVD almak, sıralamayı azaltmak ve son olarak veri kümesini yeni düşük sıralı alanla eşlemektir. Yeni alanda, her boyut maksimum varyansın bir "yönüne" karşılık gelir.
- Ancak bu veri kümesinin yeni alandaki korelasyonu her zaman sıfır mıdır, yoksa bu sadece doğal olarak Gaussian veriler için mi doğrudur?
"A" ve "B" olmak üzere iki veri setim olduğunu varsayalım, burada "A" bir Gauss'tan alınan rastgele örneklenmiş noktalara karşılık gelirken, "B" başka bir dağıtımdan rastgele örneklenmiş noktalara karşılık gelir (Poisson diyelim).
- PCA (A), PCA (B) ile nasıl karşılaştırılır?
- Yeni alandaki noktalara bakarak, PCA'nın (A) bir Gaussian'dan örneklenen noktalara karşılık geldiğini nasıl belirleyebilirim, PCA (B) ise bir Poisson'dan örneklenen noktalara karşılık gelir?
- "A" daki noktaların korelasyonu 0 mı?
- "B" deki noktaların korelasyonu da 0 mı?
- Daha da önemlisi, "doğru" soruyu mu soruyorum?
- Korelasyona bakmalı mıyım yoksa dikkate almam gereken başka bir metrik var mı?