Faktör Analizi / PCA'da rotasyon yapmanın arkasındaki sezgisel sebep nedir ve nasıl uygun rotasyon seçilmeli?


33

Sorularım

  1. Faktör analizinde (veya PCA'daki bileşenler) faktörlerin dönmesini yapmanın ardındaki sezgisel sebep nedir?

    Anladığım kadarıyla eğer değişkenler üst bileşenlere (veya faktörlere) neredeyse eşit olarak yüklenirse, o zaman açıkça bileşenleri ayırt etmek zordur. Dolayısıyla bu durumda bileşenlerin daha iyi bir şekilde ayırt edilebilmesi için rotasyon kullanılabilir. Bu doğru mu?

  2. Rotasyon yapmanın sonucu nedir? Bu neyi etkiler?

  3. Uygun rotasyon nasıl seçilir? Ortogonal ve eğik dönüşler vardır. Bunlar arasında nasıl seçim yapılır ve bu seçimin sonuçları nelerdir?

Lütfen en az matematiksel denklemlerle sezgisel olarak açıklayın. Yayılmış cevapların birkaçı matematik ağırdı ancak sezgisel sebepler ve temel kurallar için daha fazlasını arıyorum.

Yanıtlar:


34
  1. Dönme nedeni . Rotasyonlar, faktör analizinde (veya PCA'yı bir faktör analitik tekniği olarak kullanmaya teşebbüs ediyorsanız, bileşenlerde) çıkarılan faktörlerin yorumlanması için yapılır. Anlayışınızı tanımlarken haklısınız. Döndürme, basit matris olarak adlandırılabilecek yükleme matrisinin bir yapısının peşinde yapılır . Farklı faktörler farklı değişkenleri yüklemek için eğilimi olduğunu 11. ["Bir faktörün bir değişkeni" bir değişkenin bir faktörü yüklediğinden "" bir değişkeni "yükleyeceğini söylemenin daha doğru olduğuna inanıyorum, çünkü bunları ilişkilendirmek için değişkenlerin" içinde "veya" arkasında "olan faktördür; istediğiniz gibi.] Bir anlamda, tipik basit yapı, ilişkili değişkenlerin "kümelerinin" ortaya çıktığı yerdir. Daha sonra bir faktörü , faktör tarafından yeterince yüklenmiş değişkenlerin anlamlarının kesişiminde yatan anlam olarak yorumluyorsunuz ; bu nedenle, farklı anlamlar almak için faktörler değişkenleri diferansiyel olarak yüklemelidir. Temel bir kural, bir faktörün en az 3 değişkeni makul bir şekilde yüklemesi gerektiğidir.

  2. Sonuçlar . Dönme, değişkenlerin birbirine bağlı olarak faktörlerin uzaydaki yerini değiştirmez, yani değişkenler arasındaki korelasyonlar korunur. Değişen, değişken vektörlerin son noktalarının faktör eksenleri üzerindeki koordinatlarıdır - yükler (lütfen bu siteyi "yükleme grafiği" ve "çift katlı" için daha fazla bilgi için arayın) 2 . Yükleme matrisinin ortogonal bir dönüşünden sonra , faktör değişimleri değişir, ancak faktörler birbiriyle ilişkilendirilmeden kalır ve değişken topluluklar korunur.2

    Bir In eğik dönme faktörler olduğunu net bir "basit bir yapıya" üretecek eğer onların uncorrelatedness kaybetmeye izin verilir. Bununla birlikte, ilişkili faktörlerin yorumlanması daha zor bir sanattır, çünkü bir faktörden anlam çıkarmanız gerekir, böylece birbiriyle ilişkili olduğu başka birinin anlamını kirletmez. Bu, faktörleri yorumlamanız, paralel olarak söylemeliyiz ve tek tek değil demek anlamına gelir. Model matrisi: iki yükleri matrisleri bir yerine eğik dönüş yaprakları da P ve yapı matris S . ( S=PC , burada C , faktörler arasındaki korelasyon matrisidir; C=S'Sburada S , eğik dönme matrisidir: S=birS , bir , herhangi bir dönmeden önce yükleme matrisidir.) Desen matrisi, yapı matrisi korelasyonlarken faktörlerin değişkenleri öngördüğü regresyonel ağırlık matrisidir (veya kovaryanslar) faktörler ve değişkenler arasında. Çoğu zaman biz yorumlamak bu katsayılar bir değişkene faktörünün eşsiz bireysel yatırımı temsil ettikleri için desen yüklemeler tarafından faktörleri. Eğik dönme değişken communalities korur, ancak communalities artık kareler satır toplamları eşit P veya S. Dahası, faktörler ilişkili olduğu için, varyansları kısmen üst üste 3 .3

    Hem dikey hem de eğik dönüşler, hesaplamak isteyebileceğiniz faktör / bileşen puanlarını etkiler (lütfen bu sitede "faktör puanları" nı arayın). Rotasyon, aslında, ekstraksiyon 4'ten hemen sonra yaptığınız faktörlerden başka faktörler verir . Tahmini güçlerini devralırlar (değişkenler ve korelasyonlar için) ancak sizden farklı temel anlamlar kazanacaklar. Rotasyondan sonra, "bu faktör ondan daha önemli" diyemezsiniz çünkü birbirlerine karşı döndürülmüşlerdir (dürüst olmak gerekirse, FA'de, PCA'nın aksine, ekstraksiyondan sonra bile zor diyebilirsiniz çünkü faktörler zaten "önemli" olarak modellenmiştir).4

  3. Seçim . Ortogonal ve eğik dönmelerin birçok biçimi vardır. Niye ya? İlk olarak, çünkü "basit yapı" kavramı tek taraflı değildir ve biraz farklı şekilde formüle edilebilir. Örneğin , en popüler ortogonal yöntem olan varimax , her faktörün yüklerinin kare değerleri arasındaki farkı maksimize etmeye çalışır; bazen kullanılan ortogonal yöntem quartimax , bir değişkeni açıklamak için gereken faktör sayısını en aza indirir ve genellikle "genel faktör" olarak adlandırılır. İkincisi, farklı rotasyonlar basit yapıdan farklı olarak farklı yan hedeflere yöneliktir. Bu karmaşık konuların ayrıntılarına girmeyeceğim, ancak bunlar hakkında kendiniz için okumak isteyebilirsiniz.

    Dik veya eğik dönüş tercih edilmeli mi? Peki, ortogonal faktörlerin yorumlanması daha kolaydır ve tüm faktör modeli istatistiksel olarak daha basittir (elbette ortogonal prediktörler). Ancak orada keşfetmek istediğiniz gizli özelliklere diklik yüklüyorsunuz ; Çalıştığınız alanda ilgisiz olmaları gerektiğine emin misiniz? Ya onlar değilse? Eğik dönme yöntemleri 55(her biri kendi eğilimlerine sahip olsa da), birbiriyle ilişkili faktörlere izin verir, ama zorlamaz, dolayısıyla daha az kısıtlayıcıdır. Eğik dönüş, faktörlerin yalnızca zayıf bir korelasyon gösterdiğini gösteriyorsa, "gerçekte" olduğundan emin olabilirsiniz ve sonra iyi bir vicdanla dikgen dönmeye dönebileceğinizden emin olabilirsiniz. Hatırlama bir faktör olduğunu - faktörleri, diğer taraftan, çok ilişkili ise, bu, psikoloji veya bu tür bir envanter gelişmekte, özellikle de kavramsal olarak ayrı gizli özellikler için (doğal olmayan görünüyor olduğunu kendisinin tek değişkenli bir özellik değil, bir toplu fenomen), ve daha az faktör çıkarmak isteyebilirsiniz veya alternatif olarak ikinci dereceden faktörleri denemek için eğik sonuçları toplu kaynak olarak kullanmak isteyebilirsiniz.


1

görüntü tanımını buraya girin

Bu tamamen keşif amaçlı FA içindir, bir anket oluşturmak için FA yapıyor ve yineliyorsanız, sonunda sadece iki faktörünüz olması koşuluyla mavi puanlar dışındaki tüm noktaları bırakmak isteyeceksiniz. İkiden fazla faktör varsa, diğer faktörlerin yükleme alanlarındaki kırmızı noktaların mavi olmasını istersiniz.


2

görüntü tanımını buraya girin


3SSbir1-R,ben2C-1


4


5(genellikle) veya onsuz. Normalleştirme, tüm değişkenleri rotasyonda eşit derecede önemli yapar.


Daha fazla okumak için bazı konular:

Faktörleri döndürmemek için sebep olabilir mi?

Eğik dönüşten sonra hangi matrisin yorumlanacağı - desen veya yapı?

Faktör döndürme tekniklerinin (varimax vb.) Adları ne anlama geliyor?

Bileşenleri olan PCA hala PCA döndürülmüş mü yoksa bir faktör analizi mi?


1
+1. Bu soruyu gördüğümden beri, bir cevaba katkıda bulunacağınızı umuyordum. Bu arada, böyle bir sorunun daha önce burada sorulmamasına şaşırdım (en azından böyle net bir şekilde değil).
Amip Reinstate Monica,

+1. Yanıt için teşekkürler! 1) Faktör analizi ve PCA'yı ayrı ayrı anlıyorum, ancak "faktör analitik bir teknik olarak PCA" ile neyi kastediyorsunuz? PCA ve FA, 2 ayrı amaç hakkını karşılayacak 2 farklı şey mi? Bu, herhangi bir PCA bileşeni karmaşık bir yapıya sahip olduğunda basitleştirmek için rotasyon kullanamadığım anlamına mı geliyor?
GeorgeOfTheRF

2) "Varimax, her faktörün yükleri arasındaki varyansı maksimize etmeye çalışıyor" Yüklemeler arasındaki varyansı maksimize etmenin avantajı nedir?
GeorgeOfTheRF

Yorumlarınızdaki (1) için: Evet, iki analiz metodu farklıdır. Yine de insanlar PCA'yı bazen FA amacıyla kullanırlar. Cevabımı ve oradaki tüm konuyu gör . PCA'daki faktör dönüşlerini aynen FA'deki gibi aynı aralıklarda kullanabilirsiniz. Dönme ile ilgili olarak, hiçbir fark yoktur.
ttnphns

Yorumunuz için (2). Varimax, yüklerin mutlak büyüklüğündeki varyansı maksimuma çıkarır: sonuç olarak, her faktör için faktör yükleri açıkça (kesinlikle) büyük ve küçük olarak bölünür. Quartimax, her değişkeni yalnızca bir faktör tarafından yüklenecek şekilde yapmaya çalışır.
ttnphns
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.