PCA skorlarını yorumlama


16

PCA skorlarını yorumlamamda bana yardımcı olan var mı? Verilerim ayılara karşı tutumlar üzerine bir anketten geliyor. Yüklere göre, temel bileşenlerimden birini "ayı korkusu" olarak yorumladım. Söz konusu ana bileşenin puanları, her katılımcının söz konusu ana bileşene (nasıl olumlu / olumsuz puan verdiğini) ölçtüğü ile ilgili midir?


Sorunuzun kısa cevabı EVET.
amip: Reinstate Monica

Yanıtlar:


13

Temel olarak faktör puanları, faktör yükleri tarafından tartılan ham yanıtlar olarak hesaplanır. Bu nedenle, her bir değişkenin ana bileşenle nasıl ilişkili olduğunu görmek için ilk boyutunuzun faktör yüklerine bakmanız gerekir. Spesifik değişkenlerle ilişkili yüksek pozitif (sırasıyla negatif) yüklerin gözlenmesi, bu değişkenlerin bu bileşene pozitif (sırasıyla negatif) katkıda bulunduğu anlamına gelir; bu nedenle, bu değişkenler üzerinde yüksek puan alan insanlar, bu özel boyut üzerinde daha yüksek (sırasıyla daha düşük) faktör puanlarına sahip olma eğilimindedir.

Korelasyon çemberinin çizilmesi, birinci asıl eksene (varsa) "pozitif" ve "negatif" (varsa) katkıda bulunan değişkenler hakkında genel bir fikre sahip olmak için yararlıdır, ancak R kullanıyorsanız, FactoMineR paketine bir göz atabilirsiniz.dimdesc() işlevi.

USArrestsVerileri içeren bir örnek :

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

En son sonuçtan da görüleceği gibi, ilk boyut esas olarak şiddet eylemlerini (her türlü) yansıtır. Bireysel haritaya bakarsak, sağda bulunan devletlerin bu tür eylemlerin en sık olduğu devletler olduğu açıktır.

alternatif metin alternatif metin

Bu ilgili soru ile de ilgilenebilirsiniz: Temel bileşen puanları nedir?


5

Bana göre, PCA puanları sadece veri setini daha az değişkenle açıklamama izin veren bir biçimde yeniden düzenlemelerdir. Puanlar, her bir öğenin bileşenle ne kadar ilişkili olduğunu gösterir. Bunları faktör analizine göre adlandırabilirsiniz, ancak PCA yalnızca ortak tutulan öğeleri değil (faktör analizinin yaptığı gibi) veri kümesindeki tüm varyansları analiz ettiğinden, gizli değişkenler olmadığını hatırlamak önemlidir.


Evet, FA yerine PCA'ya hiçbir hata modelinin dahil edilmediğini söylemekte haklısınız. Bu nokta için + 1'ledim. PCA'dan çıkarılan temel bileşenlerin gerçek LV'ler olmadığını değil, "dikkate almak mantıklı" dedim. Ölçek güvenilirliğini veya ölçüm modellerini değerlendirmekle ilgilenmediğiniz sürece, PCA veya FA kullanmanız çok az fark yaratır. Şimdi, veri analizi genellikle değişkenler arasındaki korelasyonu açıklamak veya özne grupları bulmakla ilgilidir, dolayısıyla faktöriyel alanın bir veya daha fazla boyutunu yorumlama fikri . (...)
chl

(...) FactoMineR şaraplar hakkında bir veri seti içerir ve onunla oynamak için birçok faktör yöntemi kullanılabilir (PCA, MFA) ve hatta Michel Tenenhaus tarafından yapılan PLS veya CCA.
chl

@ chl, Pakete ilişkin ipucu için teşekkürler, bunu kontrol edeceğim. PCA ve FA'da bir noktaya kadar katılıyorum. Toplulukların (ortak varyans) tahminlerinin belirli bir faktör yapısının değerinin değerlendirilmesinde çok yararlı olması nedeniyle çoğu uygulama için FA'yı tercih ederim. Ancak bu sadece kişisel bir tercih olabilir.
richiemorrisroe

Tamamen haklısın. CAA, MFA, MCA ile birlikte (analiz edilmemiş) PCA'nın veri analizinde (özellikle Fransız okulunda) kendi geçmişi vardır. Öte yandan, Paul Kline'ın Kişilik araştırmasında FA kullanımı hakkında çok güzel iki kitabı var. Ve William Revelle'nin yaklaşan kitabı R kullanıcıları için sallanmalı :) Her durumda, bunların bir korelasyon matrisinin yapısını analiz etmek için yararlı araçlar olduğunu kabul ediyoruz.
chl

0

PCA sonuçları (farklı boyutlar veya kompmperler) genellikle gerçek bir konsepte çevrilemez. Bileşenlerden birinin "ayılar korkusu" olduğunu varsaymanın yanlış olduğunu düşünüyorum. Temel bileşenler prosedürü, veri matrisinizi aynı veya daha az sayıda boyuta sahip yeni bir veri matrisine dönüştürür ve ortaya çıkan boyutlar, varyansı daha az açıklayan olana daha iyi açıklayandan farklıdır. Bu bileşenler, orijinal değişkenlerin hesaplanan özvektörlerle kombinasyonuna göre hesaplanır. Aşırı PCA prosedürü orijinal değişkenleri ortogonal olanlara dönüştürür (doğrusal olarak bağımsız). Umarım bu pca prosedürü hakkında biraz açıklığa kavuşmanıza yardımcı olur


Bazı değişkenlerin doğrusal bir kombinasyonunun yine de her birinin faktör eksenine bir tür ağırlıklı katkısını yansıtıyor olarak yorumlanabileceğini kabul eder misiniz?
chl

Evet, aynen öyle.
mariana soffer

Öyleyse, neden bir isim vermemek? Değişkenler sadece tezahür eden değişkenler olarak kabul edilir ve bazı durumlarda ağırlıklı kombinasyonlarının gizli (gözlemlenmemiş) bir faktörü yansıttığı düşünülür.
chl
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.