Temel bileşen analizinde biplotların yorumlanması


30

Bu güzel derse rastladım: R Kullanarak İstatistiksel Analiz El Kitabı. Bölüm 13. Temel Bileşen Analizi: PCA'nın R dilinde nasıl yapıldığına dair Olimpik Heptatlon . Şekil 13.3'ün yorumunu anlamıyorum:

Biplot

Bu yüzden ilk özvektöre karşı ikinci özvektöre komplo yapıyorum. Bu ne anlama geliyor? Birinci özvektöre karşılık gelen özdeğerin, veri kümesindeki değişimin% 60'ını açıkladığını ve ikinci özdeğer özvektörünün değişimin% 20'sini açıkladığını varsayalım. Bunları birbirlerine karşı koymak ne anlama geliyor?


Yanıtlar:


22

PCA, verilen bir korelasyon matrisinin yapısını analiz etmenin birçok yolundan biridir. Yapım gereği, birinci ana eksen, veriler bir çizgiye ( -boyutsal alanda bir yön anlamına gelir , değişkenleri varsayarsak ) bir çizgiye yansıtıldığında varyansı maksimuma çıkaran (özdeğeriyle yansıtılır ) ve ikincisidir. buna dik, ve hala kalan varyansı maksimize eder. Bu, ilk iki eksenin kullanılmasının, bir düzlem üzerine yansıtıldığında orijinal değişkenler uzayının (örneğin, dim matrisi daha iyi bir tahminini vermesinin nedenidir .ppXn×p

Temel bileşenler sadece orijinal değişkenlerin doğrusal kombinasyonlarıdır. Bu nedenle, (olarak tanımlanır bireysel faktör puanlarını gösteren , herhangi bir ana bileşeninin yükleri vektörüdür), örneğin, homojen bir birey grupları vurgulamak için yardımcı olabilir, veya aynı anda tüm değişkenler göz önüne alındığında bir genel puanlama yorumlamak. Başka bir deyişle, bu, kişinin üzerindeki değeri ile ilgili konumunu özetlemenin bir yoludur.Xuupdeğişkenler veya bunların bir kombinasyonu. Sizin durumunuzda, HSAUR’daki Şekil 13.3, Joyner-Kersee’nin (Jy-K) 1. eksende yüksek (negatif) bir puan aldığını ve tüm olaylarda oldukça iyi performans gösterdiğini gösteriyor. Aynı ekseni, ikinci ekseni yorumlamak için de geçerlidir. Rakama çok kısa bir göz atacağım, böylece ayrıntılara girmeyeceğim ve yorumum kesinlikle yüzeysel. HSAUR ders kitabında daha fazla bilgi bulacağınızı farz ediyorum. Burada hem değişkenlerin hem de bireylerin aynı diyagramda gösterildiğine dikkat etmek önemlidir (buna ikiplot denir)) Bireylerin bulunduğu yere bakarken faktör eksenlerini yorumlamaya yardımcı olur. Genellikle değişkenleri bir korelasyon çemberine çizeriz (burada burada vektörler olarak temsil edilen herhangi bir iki değişken tarafından oluşturulan açı, onların gerçek ikili korelasyonunu yansıtır, çünkü ).r(x1,x2)=cos2(x1,x2)

Bununla birlikte, PCA tabanlı yöntemlerle ilgili derinlemesine bilgi edinmek için çok değişkenli analiz konusunda bazı tanıtım kitaplarını okumaya başlamanız gerektiğini düşünüyorum. Örneğin, BS Everitt Bu konu, üzerinde mükemmel bir ders kitabı yazdı An R ve S-Plus ® değişkenli Analiz Companion ve kontrol edebilirsiniz refakatçi web sitesi gösterim için. Uygulanan çok değişkenli veri analizi için ade4 ve FactoMineR gibi başka büyük R paketleri de var .


Yanılıyor olabilirim ama iki vektör arasındaki ikili ilişki değildir değil ? r(x1,x2)=cos(x1,x2)cos2(x1,x2)
Ocak’ta

21

Arsa gösteriliyor:

  • ilk iki ana bileşendeki her bir durumun (yani sporcunun) puanı
  • her iki değişkenin (yani, her spor olayı) ilk iki ana bileşen üzerine yüklenmesi.

Sol ve alt eksenler [normalize] ana bileşen skorlarını gösteriyor; üst ve sağ eksenler yükleri gösteriyor.

Genel olarak, iki bileşenin, vakaların ve değişkenlerin yapısının anlamlı bir görsel sunumunu sağlamak için yeterli bir varyans miktarını açıkladığını varsaymaktadır.

Uzayda hangi olayların birbirine yakın olduğunu görmek için bakabilirsiniz. Bunun geçerli olduğu yerlerde, bu bir olayda iyi olan sporcuların diğer proksimal olaylarda da iyi olma ihtimalini ortaya çıkarabilir. Alternatif olarak, hangi olayların uzak olduğunu görmek için arsa kullanabilirsiniz. Örneğin, cirit bir aykırı ve ikinci ana bileşeni tanımlayan büyük bir olay gibi görünmektedir. Belki de farklı türde bir atlet ciritte diğer etkinliklerin çoğunda iyi olandan iyidir.

Tabii ki, önemli yorumlama hakkında daha fazla şey söylenebilir.



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.