PCA biplotundaki oklar ne anlama geliyor?


14

Aşağıdaki PCA biplotunu düşünün:

library(mvtnorm)
set.seed(1)
x  <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5))))
x  <- scale(x, center=T, scale=F)
pc <- princomp(x)
biplot(pc)

resim açıklamasını buraya girin

Bir sürü kırmızı ok çizilir, ne anlama geliyorlar? "Var1" ile etiketlenmiş ilk okun veri kümesinin en değişken yönünü göstermesi gerektiğini biliyordum (eğer bunları 2000 veri noktası olarak düşünürsek, her biri 6 boyutlu bir vektördür). Ayrıca bir yerden okudum, en değişken yön 1. öz vektörünün yönü olmalıdır.

Bununla birlikte, R'deki biplot kodunu okumak. Oklarla ilgili çizgi:

if(var.axes)
    arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L], 

yÖzvektör matrisi olan aslında yükleme matrisi nerede . 1 ok aslında dan işaret ediyor gibi Öyle görünüyor (0, 0)için (y[1, 1], y[1, 2]). Anladığım kadarıyla 2D boyutlu bir düzlemde yüksek boyutlu bir ok çizmeye çalışıyoruz. Bu yüzden y[1, ]vektörün 1. ve 2. elemanlarını alıyoruz . Ancak anlamıyorum:

1. özvektör yönü vektör y[, 1]yerine ile gösterilen değil y[1, ]mi? (Yine, burada yPCA veya özdiyokompozisyonu ile elde edilen özvektör matrisi bulunmaktadır t(x) %*% x.) Yani özvektörler, bu yatay vektörler değil sütun vektörleri olmalıdır.

Onları 2D düzlemde çiziyor olsak da, (0, 0)işaret etmek için 1. yönü çizmeliyiz (y[1, 1], y[2, 1])?


2
Ayrıca, sitedeki sorular için kullanılabilir biçimlendirmeyi kullanmaya çalışın , gelişmiş işaretleme yardımına bakın . Önceki sorularınızın hiçbirinin cevapları olmadığını görüyorum ve bunları biraz daha okunabilir olacak şekilde düzenlerseniz, listenin en üstüne çıkacaklar ve cevapları çekebilecekler.
Andy W

@Andy W Mükemmel referanslar
konjugateprior

@Andy W: Mükemmel referanslarınızı okuduktan sonra, Rip biplot.princomp'ın bir hata olduğunu düşünüyorum: biplot.princomp içine gönderilmeden önce yükleme matrisi (özvektör matrisi) aktarılmalıdır ... Herhangi bir düşünce?
Luna

Hata yok gibi görünüyor .
chl

@Andy W: Cevabınızı kabul edebilmem için yorumlarınızı bir "cevaba" koymak ister misiniz? Harika bir tane! Çok teşekkürler!
Luna

Yanıtlar:


9

Görünüşe göre Kevin Wright, karışıklığı açıklamaya yardımcı olmak için kredinin çoğuna verilmelidir ( R-yardım posta listesinden );

Oklar, verilerin en değişken yönüne işaret etmiyor. Temel bileşenler verilerin en değişken yönüne işaret etmektedir. Ancak, verileri orijinal ölçekte çizmiyorsunuz, verileri döndürülmüş ölçekte çiziyorsunuz ve bu nedenle yatay eksen, verilerin en değişken yönüdür.

Oklar, biplotun 2 boyutlu düzlemine yansıtıldığı gibi değişkenlerin yönünü göstermektedir.

Hata yok.

Kevin Wright

Michael Greenacre, biplots, Pratik Biplots hakkında çok mükemmel bir ücretsiz çevrimiçi kitaba sahiptir ve sadece ilk bölümü okumak, okların koordinatlarının nereden alındığını motive etmelidir. Orada benzer sitesinde diğer bazı sorular da vardır ve ilginizi çekebilir, bkz Ar başlıca bileşenleri analizinde biplots yorumlanması ve MDS faktör arsa yorumlanması iki örnek için. Ayrıca , sitedeki aramada biplotlu soruları da inceleyin , çünkü potansiyel ilgiden birkaç tane daha var (belki bir biplot etiketi yapmak bile, bu noktada ortaya çıkan soru sayısı göz önüne alındığında yararlı olacaktır).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.