PCA biplotu üretmenin birçok farklı yolu vardır ve bu nedenle sorunuzun benzersiz bir cevabı yoktur. İşte kısa bir genel bakış.
Veri matrisi varsayalım sahip N satır veri noktaları ve (örneğin, kolon araçlarının hepsi sıfır) ortalanır. Şimdilik, do not bunun standardize edilmiş farz, biz kovaryans matrisi (değil korelasyon matrisi üzerinde) üzerinde PCA düşünün yani. PCA tek bir değer ayrışması anlamına gelir X = U S V ⊤ , detaylar için cevabımı burada görebilirsiniz: SVD ve PCA arasındaki ilişki. PCA gerçekleştirmek için SVD nasıl kullanılır?Xn
X=USV⊤,
Bir PCA biplotunda, iki birinci ana bileşen bir dağılım grafiği olarak çizilir, yani ilk sütunu ikinci sütununa karşı çizilir. Ancak normalleştirme farklı olabilir; örneğin:U
- sütunları : bunlar, birim kareler toplamına ölçeklendirilmiş temel bileşenlerdir;U
- √ sütunları: bunlar standart ana bileşenlerdir (birim varyansı);n−1−−−−−√U
- Kolonları : Bu "ham" temel bileşenler (ana yönü ile ilgili projeksiyonları) vardır.US
Ayrıca, orijinal değişkenler oklar olarak çizilir; yani bir i- ok ok uç noktasının koordinatları , V'nin birinci ve ikinci sütunundaki i- değeri ile verilir . Fakat yine de, farklı normalleştirmeler seçilebilir, örneğin:(x,y)iiV
- Sütunlar : Burada bir yorum ne olabilir bilmiyorum;VS
- V S / √ sütunları : bunlar yüklemeler;VS/n−1−−−−−√
- sütunları : bunlar ana eksenlerdir (aka ana yönler, aka özvektörler).V
Tüm bunlar Fisher Iris veri kümesi için nasıl görünüyor:
9XUSαβVS(1−α)/β9 "uygun biplolar" dır: yukarıdan herhangi bir alt grafiğin doğrudan alt ile birleşimi.
[Hangi kombinasyon kullanılırsa kullanılsın, okları rasgele bir sabit faktörle ölçeklendirmek gerekebilir, böylece hem oklar hem de veri noktaları kabaca aynı ölçekte görünür.]
VS/n−1−−−−−√Un−1−−−−−√
Bu [özel seçim], elbette, bunların ikinci aşamada yeterince yakınlaştırılabilmesi şartıyla, çok değişkenli gözlem matrislerini yorumlamada en faydalı grafiksel yardım sağlayacaktır.
USV
US
biplot
UVSbiplot
0.8biplot
n/(n−1)1R'de PCA biplotunda temel değişkenlerin okları .)
Korelasyon matrisinde PCA
X1
Burada yüklemeler daha da çekici, çünkü (yukarıda belirtilen özelliklere ek olarak), 1R=1
Daha fazla okuma: