PCA sonrası eğik rotasyon kullanımı hakkında


9

SAS, SPSS ve R gibi çeşitli istatistiksel paketler, bir PCA'nın ardından bir tür faktör döndürme gerçekleştirmenizi sağlar.

  1. PCA'dan sonra rotasyon neden gereklidir?
  2. PCA'nın amacının dikey boyutlar üretmesi göz önüne alındığında, neden bir PCA'dan sonra eğik bir rotasyon uygularsınız?

PCA önyargılı sonuç verdiğinden PCA'dan sonra faktör rotasyonu ihtiyacını gösteren bir soru sordum. Bkz stats.stackexchange.com/questions/6575/...
mbaitoff

Yanıtlar:


8

PCA hakkında farklı görüşler veya görüşler olduğunu düşünüyorum, ancak temelde bunu bir azaltma tekniği olarak düşünüyoruz ( özellik alanınızı daha küçük bir teknike indiriyorsunuz, genellikle çok daha "okunabilir". gerektiğinde veriler) veya gizli faktörler oluşturmanın bir yoluveya bireyler arası dağılımın önemli bir bölümünü oluşturan boyutlar (burada "bireyler", verilerin toplandığı istatistiksel birimleri ifade eder; bu ülke, insanlar vb. olabilir). Her iki durumda da, herhangi bir iki ana bileşen arasındaki diklik kısıtlamasına tabi olarak, maksimum değişkenliği (ana eksende yansıtıldığında) açıklayan orijinal değişkenlerin doğrusal kombinasyonlarını inşa ederiz. Şimdi, tarif edilen şey tamamen cebirsel veya matematikseldir ve bunu bir tür ölçüm hatasını hesaba katmak için bir hata terimini içerdiğimiz faktör analizi geleneğinde yapılanın aksine, (üreten) bir model olarak düşünmüyoruz. . Ayrıca William Revelle tarafından R kullanarak uygulamalı psikometri üzerine çıkacak olan el kitabında verilen tanıtımı da seviyorum. (Bölüm 6), bir korelasyon matrisinin yapısını analiz etmek istiyorsak,

Birincisi [yaklaşım, PCA], her bileşenin değişkenlerin ağırlıklı bir doğrusal toplamı olduğu bileşenlerin çarpımı açısından korelasyon matrisine yaklaşan bir modeldir, ikinci model [faktör analizi] de korelasyon matrisinin iki faktörün çarpımı olmakla birlikte, bu faktörler değişkenlerin sonuçları yerine nedenler olarak görülmektedir.

Diğer bir deyişle, PCA ile her bir bileşeni (faktörü) değişkenlerin doğrusal bir kombinasyonu olarak ifade ederken, FA'da bunlar faktörlerin doğrusal bir kombinasyonu olarak ifade edilen değişkenlerdir. Her iki yöntemin genel olarak oldukça benzer sonuçlar vereceği kabul edilmektedir (bakınız örneğin Harman, 1976 veya Catell, 1978), özellikle çok sayıda bireye ve iyi bir oran faktörüne sahip olduğumuz "ideal" durumda: değişkenler (tipik olarak değişkenlik Düşündüğünüz yazarlara bağlı olarak 2 ile 10 arasında!). Bunun nedeni, korelasyon matrisindeki köşegenleri tahmin ederek (FA'da olduğu gibi ve bu elemanlar topluluklar olarak bilinir), hata varyansı faktör matrisinden elimine edilir. PCA'nın geçen yüzyılda geliştirilen FA yerine gizli faktörleri veya psikolojik yapıları ortaya çıkarmanın bir yolu olarak sıklıkla kullanılmasının nedeni budur. Ancak, bu şekilde ilerledikçe, genellikle ortaya çıkan faktör yapısının (veya desen matrisi olarak adlandırılan) daha kolay bir yorumuna ulaşmak istiyoruz. Ve sonra faktöriyel ekseni döndürmenin faydalı hilesi gelir, böylece değişkenlerin belirli bir faktör üzerindeki yüklerini en üst düzeye çıkarırız veya eşdeğer bir şekilde "basit bir yapıya" ulaşırız. Dik döndürme (örn. VARIMAX) kullanarak, faktörlerin bağımsızlığını koruyoruz. Eğik rotasyonla (örneğin OBLIMIN, PROMAX), onu kırıyoruz ve faktörlerin korelasyonuna izin veriliyor. Bu, literatürde büyük ölçüde tartışılmıştır ve bazı yazarlara (psikometrikçiler değil, 1960 başlarında istatistikçiler) öncülük etmiştir.

Ancak asıl nokta, rotasyon yöntemlerinin başlangıçta FA yaklaşımı bağlamında geliştirilmiş olması ve şimdi rutin olarak PCA ile kullanılmasıdır. Bunun temel bileşenlerin algoritmik hesaplamasına aykırı olduğunu düşünmüyorum: Faktör ekseninin yorumlanmasının daha az belirgin hale geldiğini aklınızda bulundurmanız koşuluyla, faktör eksenlerinizi istediğiniz gibi döndürebilirsiniz.

PCA yeni anketler geliştirilirken rutin olarak kullanılır, ancak FA bu durumda daha iyi bir yaklaşımdır, çünkü ölçüm hatalarını dikkate alan ve ilişkileri kendi başlarına incelenebilecek anlamlı faktörleri çıkarmaya çalışıyoruz (örn. matris, biz ikinci dereceden bir faktör modeli olsun). Ancak PCA, daha önce onaylanmış olanların faktör yapısını kontrol etmek için de kullanılır. Araştırmacılar, FA ile PCA hakkında gerçekten önemli değil, diyelim ki beş boyutla mücadele eden 60 maddelik bir anketi derecelendirmek isteyen 500 temsilci konu (bu NEO-FFI için geçerli(örneğin) ve bence haklılar çünkü bu durumda, üreten veya kavramsal bir modeli tanımlamakla çok fazla ilgilenmiyoruz (burada " ölçüm değişmezliği sorununu hafifletmek için" temsilci "terimi kullanılır ).

Şimdi, rotasyon yönteminin seçimi ve bazı yazarların neden dik rotasyonun katı kullanımına karşı tartıştıkları hakkında, aşağıdaki soruya cevap verdiğim gibi Paul Kline'a alıntı yapmak istiyorum, FA: “Basit Yapıya dayalı olarak Rotasyon matrisi seçme Kriterler ” ,

(...) gerçek dünyada, davranışın önemli belirleyicileri olarak faktörlerin ilişkili olacağını düşünmek mantıksız değildir. - P. Kline, İstihbarat. Psikometrik Görüş , 1991, s. 19

Bu nedenle, çalışmanızın amacına bağlı olarak (korelasyon matrisinizin ana modellerini vurgulamak ister misiniz veya böyle bir korelasyon matrisini gözlemlemenize neden olabilecek temel mekanizmaların mantıklı bir yorumunu yapmak ister misiniz? ), en uygun yöntemi seçmek üzeresiniz: Bunun lineer kombinasyonların inşası ile ilgisi yoktur, sadece ortaya çıkan faktöriyel alanı yorumlamak istediğiniz yolla ilgilidir.

Referanslar

  1. Harman, HH (1976). Modern Faktör Analizi . Chicago, Chicago Press Üniversitesi.
  2. Cattell, RB (1978). Faktör Analizinin Bilimsel Kullanımı . New York, Plenum.
  3. Kline, P. (1991). Zeka. Psikometrik Bakış . Routledge.

4

Dik boyutlardaki sorun, bileşenlerin yorumlanamayacağıdır. Böylece, eğik dönme (yani, dikey olmayan boyutlar) teknik olarak daha az tatmin edici olurken, böyle bir dönme bazen elde edilen bileşenlerin yorumlanabilirliğini arttırır.


4

Temel Noktalar

  • Döndürme bileşenlerin yorumlanmasını daha net hale getirebilir
  • Eğik dönüş genellikle daha teorik bir anlam taşır. Yani, gözlemlenen değişkenler, daha az sayıda ilişkili bileşen açısından açıklanabilir.

Misal

  • 10 tüm ölçüm yeteneklerini bazı ölçüm sözel ve bazı ölçüm uzamsal yetenekleriyle test eder. Tüm testler birbiriyle ilişkilidir, ancak sözel veya uzamsal testler içindeki karşılıklı ilişkiler test türünden daha büyüktür. Cimri bir PCA, sözel ve uzamsal olmak üzere iki ilişkili bileşeni içerebilir. Teori ve araştırma, bu iki yeteneğin birbiriyle ilişkili olduğunu göstermektedir. Böylece, eğik bir dönme teorik anlam ifade eder.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.