Bu konuyla ilgili bazı karışıklıklar var, bu yüzden bazı gözlemler ve literatürde mükemmel bir cevabın bulunabileceği için bir işaretçi sunacağım.
İlk olarak, PCA ve faktör analizi (FA) vardır benzer. Genel olarak, ana bileşenler tanım gereği ortogonaldir, oysa faktörler - FA'deki benzer varlık - değildir. Basitçe ifade etmek gerekirse, temel bileşenler, verinin saf öz-analizinden elde edilmelerinden dolayı, faktör uzayını isteğe bağlı fakat zorunlu olarak yararlı olmayan bir şekilde kapsar. Öte yandan, faktörler tesadüfen yalnızca dik (yani ilgisiz veya bağımsız) olan gerçek dünya varlıklarını temsil eder.
Aldığımız Say ın her birinden gözlemlerini l konularda. Bu veri matris içine yerleştirilmiş olabilir D sahip ler satır ve l sütunlar. D , bir skor matrisi S'ye ve bir yükleme matrisi L'ye , D = SL olacak şekilde ayrıştırılabilir . S olacaktır s satır ve L olacak l sütun, her bir faktör sayısı olmak ikinci boyut , n . Faktör analizinin amacı, D' yi parçalamaktır.altta yatan puanları ve faktörleri ortaya çıkaracak şekilde. L'deki yüklemeler bize D' deki gözlemleri oluşturan her bir puanın oranını söylemektedir .
PCA'da L , D' nin korelasyon veya kovaryans matrisinin özvektörlerine sütun olarak sahiptir. Bunlar geleneksel olarak karşılık gelen özdeğerlerin azalan düzeninde düzenlenir. Değeri n - önemli temel bileşenlerin sayısı örneğin analizi korumak için, ve dolayısıyla sıralarının sayısı L - tipik olarak bulunabilir bir eteğindeki özdeğerler arsa veya sayısız başka yöntemden biri kullanılarak belirlenir Edebiyat. PCA'daki S sütunları n özü ana bileşenlerini oluşturur. N'nin değeri , veri kümesinin altında yatan boyutudur.
Faktör analizinin amacı, soyut bileşenleri , D = STT- 1 L olacak şekilde bir dönüşüm matrisi T kullanılarak anlamlı faktörlere dönüştürmektir . ( ST ), dönüştürülmüş puan matrisi ve ( T -1 L ) dönüştürülmüş yükleme matrisidir.
Yukarıdaki açıklama kabaca Edmund R. Malinowski'nin Kimyadaki Mükemmel Faktör Analizi'nden gösterilmesini izler . Açılış bölümlerini konuya giriş olarak tavsiye ederim.