Bilgisayar bilimi yüksek lisans öğrencisiyim. Bir araştırma projesi için keşifsel faktör analizi yapıyorum. Projeyi yöneten meslektaşlarım SPSS kullanıyor, ben R kullanmayı tercih ediyorum. İki istatistiksel paket arasında büyük bir tutarsızlık bulunana kadar bu önemli değildi.
Ekstraksiyon yöntemi olarak temel eksen faktoringini kullanıyoruz (lütfen PCA ve faktör analizi arasındaki farkın farkında olduğumu ve en azından kasıtlı olarak PCA kullanmadığımızı unutmayın). Okuduğum kadarıyla, bu R belgelerine göre, R'deki "ana eksen" yöntemine ve SPSS'de "ana eksen faktoringine" veya "ağırlıksız en küçük karelere" karşılık gelmelidir . Biz kullanan eğik dönüş yöntemi (özellikle, promax biz ilişkili faktörler bekledikleri için) ve yorumlama vardır model matrisi .
R ve SPSS'de iki prosedürü uygulayan büyük farklılıklar vardır. Desen matrisi farklı yükler verir. Bu, değişken ilişkilere az çok aynı faktörü verse de, karşılık gelen yüklemeler arasında 0.15'e kadar bir fark vardır; bu, ekstraksiyon yönteminin ve promax rotasyonlarının sadece farklı bir uygulamasıyla beklenenden daha fazla görünmektedir. Ancak, bu en şaşırtıcı fark değildir.
Faktörler tarafından açıklanan kümülatif varyans SPSS sonuçlarında yaklaşık% 40 ve R sonuçlarında% 31'dir. Bu büyük bir fark ve R yerine SPSS kullanmak isteyen meslektaşlarıma yol açtı. Bununla ilgili bir sorunum yok, ancak büyük bir fark bana bir şeyi yanlış yorumlayabileceğimizi düşündürüyor, bu bir problem.
Suları daha da çamurlandıran SPSS, ağırlıksız en küçük kareler faktoringini çalıştırdığımızda farklı türlerde açıklanmış varyans bildirir. Başlangıç Özdeğerlerine göre açıklanan varyans oranı% 40, Kareli Yüklerin Ekstraksiyon Toplamlarından (SSL) açıklanan varyans oranı% 33'tür. Bu, İlk Özdeğerlerin bakmak için uygun sayı olmadığını düşünmeme yol açıyor (bunun, dönmeden önce açıklanan varyans olduğundan şüpheleniyorum, ancak bu benim için çok büyük. Daha da kafa karıştırıcı olan SPSS, Rotasyon SSL'yi de gösterir, ancak açıklanan varyansın yüzdesini hesaplamaz (SPSS, korelasyonlu faktörlere sahip olmanın, toplam varyansı bulmak için SSL'yi ekleyemeyeceğim anlamına geldiğini ve gördüğüm matematikle anlam ifade ettiğini söyledi). R tarafından bildirilen SSL'ler bunlardan hiçbiriyle eşleşmiyor ve R bana toplam varyansın% 31'ini açıkladığını söylüyor. R'nin SSL'leri, Rotasyon SSL'leriyle en yakından eşleşir. R'nin orijinal korelasyon matrisindeki özdeğerleri, SPSS'den Başlangıç Özdeğerleriyle eşleşir.
Ayrıca, farklı yöntemler kullanarak oynadığımı ve SPSS'nin ULS ve PAF'sinin R'nin PA yöntemine en yakın şekilde eşleştiğini lütfen unutmayın.
Özel sorularım:
- Faktör analizi uygulamaları ile R ve SPSS arasında ne kadar fark beklemeliyim?
- SPSS'den Kareli Yüklerin Toplamından hangisini yorumlamalıyım, Başlangıç Özdeğerleri, Ekstraksiyon veya Rotasyon?
- Göz ardı edebileceğim başka sorunlar var mı?
SPSS ve R'ye yaptığım çağrılar aşağıdaki gibidir:
SPSS:
FACTOR
/VARIABLES <variables>
/MISSING PAIRWISE
/ANALYSIS <variables>
/PRINT INITIAL KMO AIC EXTRACTION ROTATION
/FORMAT BLANK(.35)
/CRITERIA FACTORS(6) ITERATE(25)
/EXTRACTION ULS
/CRITERIA ITERATE(25)
/ROTATION PROMAX(4).
R:
library(psych)
fa.results <- fa(data, nfactors=6, rotate="promax",
scores=TRUE, fm="pa", oblique.scores=FALSE, max.iter=25)