PCA yüklemeleri nasıl yorumlanır?


13

PCA hakkında okurken, aşağıdaki açıklama ile karşılaştım:

Her veri noktasının tek bir öğrencinin matematik testi, fizik testi, okuduğunu anlama testi ve kelime testindeki puanlarını temsil ettiği bir veri setimiz olduğunu varsayalım.

Verilerdeki değişkenliğin% 90'ını yakalayan ve yüklerini yorumlayan ilk iki temel bileşeni buluyoruz. İlk temel bileşenin genel akademik yeteneği, ikincisinin nicel yetenek ile sözel yetenek arasındaki zıtlığı temsil ettiği sonucuna vardık.

Metin PC1 ve PC2 yüklemelerinin PC1 için ve PC2 için ( 0.5 , 0.5 , - 0.5 , - 0.5 ) olduğunu ve aşağıdaki açıklamaları sunduğunu belirtmektedir:(0.5,0.5,0.5,0.5)(0.5,0.5,0.5,0.5)

[T] birinci bileşen ortalama puanla orantılıdır ve ikinci bileşen ilk puan çifti ile ikinci puan çifti arasındaki farkı ölçer.

Bu açıklamanın ne anlama geldiğini anlayamıyorum.


7
Her nasılsa @ ttnphns'ın cevabı çok fazla matematiksel ayrıntıya giriyor, ancak orijinal sorunun gerçekten basit olduğunu düşünüyorum: PC1 için (0.5, 0.5, 0.5, 0.5) yükleme vektörleri neden ilk bileşenin ortalama puanla orantılı olduğu anlamına geliyor "? Cevap, yüklerin PC1'i oluşturan orijinal değişkenlerin doğrusal kombinasyonunda katsayılarla [orantılı] olmasıdır. Yani ilk PC1'iniz, dört değişkenin tümünün çarpımı 0.5'tir. Bu, dört değişkenin ortalamasıyla orantılı olduğu anlamına gelir. PC2 ile benzer. Bunun asıl soruya cevap verdiğini düşünüyorum.
amip, Reinstate Monica

@amoeba - Yüklerin bu kadar basit bir açıklamasına rastlamanın ne kadar zor olduğunu biliyor musunuz? Her nasılsa, google'da bir sonraki açıklamaya geçmeye karar vermeden önce her yerde her tarafımdan bir jargon safra ağzı. Teşekkür ederim!
MiloMinderbinder

Yanıtlar:


13

Yükler ( özvektörlerle karıştırılmaması gereken ) aşağıdaki özelliklere sahiptir:

  1. Her bileşen içindeki karelerin toplamları özdeğerlerdir (bileşenlerin varyansları).
  2. Yükler, doğrusal kombinasyondaki (standartlaştırılmış) bileşenler tarafından bir değişkeni tahmin eden katsayılardır.

A

A (loadings)
         PC1           PC2
X1   .5000000000   .5000000000 
X2   .5000000000   .5000000000 
X3   .5000000000  -.5000000000 
X4   .5000000000  -.5000000000
Eigenvalues:
    1.0000000000  1.0000000000

Bu durumda, her iki özdeğer de eşittir. Gerçek dünyada nadir bir durumdur, PC1 ve PC2'nin eşit açıklayıcı "güç" olduğunu söylüyor.

Nx2CX^=CAAX^

A4x4B=(A1)B=Adiag(eigenvalues)1=(A+)diag(eigenvalues)özdeğerleri diyagonal üzerinde olan kare diyagonal matristir ve +üst simge psödoinverse anlamına gelir. Senin durumunda:

diag(eigenvalues):
1 0
0 1

B (coefficients to predict components by original variables):
    PC1           PC2
X1 .5000000000   .5000000000 
X2 .5000000000   .5000000000 
X3 .5000000000  -.5000000000 
X4 .5000000000  -.5000000000

XNx4C=XBC

PC1 = 0.5 * X1 + 0.5 * X2 + 0.5 * X3 + 0.5 * X4 ~ (X1 + X2 + X3 + X4) / 4

"ilk bileşen ortalama puanla orantılı"

PC2 = 0.5 * X1 + 0.5 * X2 - 0.5 * X3 - 0.5 * X4 = (0.5 * X1 + 0.5 * X2) - (0.5 * X3 + 0.5 * X4)

"İkinci bileşen, ilk puan çifti ile ikinci puan çifti arasındaki farkı ölçer"

B=A


B=Adiag(eigenvalues)1B=R1ARdeğişkenlerin kovaryans (veya korelasyon) matrisi. İkinci formül doğrudan doğrusal regresyon teorisinden gelir. İki formül yalnızca PCA bağlamında eşdeğerdir. Faktör analizinde, bunlar değildir ve faktör puanlarını (her zaman FA'da yaklaşık olarak hesaplanan) hesaplamak için ikinci formüle güvenilmelidir.


İlgili cevaplar:

Yükler ve özvektörler hakkında daha ayrıntılı bilgi .

Temel bileşen puanları ve faktör puanları nasıl hesaplanır .


2
Eğer 4 bileşenden 2'si değişkenliğin% 90'ını oluşturuyorsa özdeğerleri nasıl 2 olur?
Nick Cox

Nick, bunun OP için bir soru olduğuna inanıyorum. Verileri veya kovaryans / korelasyon matrisini vermedi. Ondan sahip olduğumuz tek şey, ilk 2 PC'nin (oldukça gerçekçi olmayan) bir yükleme matrisidir.
ttnphns

3
4×44150%90%
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.