Var olduğunda daha fazla faktörün çıkarılması her zaman daha mı iyidir?


11

Temel bileşenler analizinin aksine, faktör analizi modellerine yönelik çözümlerin mutlaka iç içe olması gerekmez. Yani, ilk faktör için yükler (örneğin) sadece ilk faktör çıkarıldığında ve ilk iki faktör olduğunda aynı olmayacaktır.

Bunu göz önünde bulundurarak, yüksek derecede korelasyonlu bir dizi manifesto değişkenine sahip olduğunuz ve (içeriklerinin teorik bilgisiyle) tek bir faktör tarafından yönlendirilmesi gereken bir durumu düşünün. Keşifsel faktör analizlerinin (hangi metriği tercih ederseniz edin: paralel analiz, dağ eteğindeki grafik, öz değerler> 1 vb.) Güçlü bir şekilde faktör olduğunu önerdiğini düşünün : Büyük bir birincil faktör ve küçük bir ikincil faktör. İlk faktör için katılımcıların değerlerini tahmin etmek (yani faktör puanları almak) için manifesto değişkenlerini ve faktör çözümünü kullanmak istiyorsunuz. Bu senaryoda, aşağıdakileri yapmak daha iyi olur:2

  1. Yalnızca faktörü ayıklamak ve faktör puanlarını (vb.) Almak için bir faktör modeli takın veya1
  2. her iki faktörü çıkarmak için bir faktör modeline uyuyor , faktörler için faktör puanları alıyor, ancak ikinci faktör için puanları atıyor / görmezden geliyor?

Hangisi daha iyi uygulama olursa, neden? Bu konuda herhangi bir araştırma var mı?


Çıkarılacak faktörlerin sayısını seçerken sadece analitik öncesi sezgisel cihazlara güvenilmemelidir. Korelasyonların yeniden üretimi (1 yerine 2 faktör çıkardığınızda ne kadar iyi olur?) Korelasyon kalıntıları bu ve bu çözümlerde nasıl dağıtılır? (normalde düzgün veya normal olmalı, uzun / şişman sağ kuyruk olmamalıdır). Veriler normalse, uyum testleri ve yükleme hataları. (ML ekstraksiyonu ile) hesaplanabilir. Tüm bu artı yorumlanabilirliğe dayanarak, mevcut durumda (1) veya (2) yolunun daha iyi olup olmadığına karar verilebilir.
ttnphns

Nihayetinde, sadece yeni örnekler / doğrulayıcı FA ikilemi sonuna kadar değerlendirebilir. Ancak bir fikir. Eğer 2. faktörü çok zayıf (küçük SS yükleri ekstre sonra) sonra iki çözelti (ve faktör 1 dolayısıyla faktör skorları) önemli ölçüde farklıdır bekliyoruz. (Çok fazla güven olmadan söylüyorum çünkü elden geçirmeden yorum yapıyorum. Ancak, mantıksal olarak, faktör düzlemi dejenere olmaya hazırsa, sonuçlar neredeyse sadece çizgi gibi olmalı ...)
ttnphns

Q unvanı Is is always better to extract more factors when they exist?çok net değil. Var olduğu kadar çok çıkarmak her zaman daha iyidir. Bahsedilen analizin çok değişkenli ve iç içe olmayan doğası nedeniyle, her iki çarpık "gerçek" gizli yapının eksik veya fazla yerleştirilmesi. Sorun şu ki, verilerimizde tam olarak kaç faktör olduğunu bilmiyoruz. Ve bu verilerin nüfusun sahip olup olmadığı.
ttnphns

1
@ttnphns, son yorumunuz sorunun kalbine geliyor sanırım. Sizi ikna etmek için hangi yöntemleri kullandığınızı, 1 faktörün neredeyse tüm paylaşılan varyasyonu hesaba katarak, yeni bir örneğe CFA dahil ve dahil olmak üzere gerçekten ikna ettiğini varsayın. Fit w / 2 önemsiz derecede daha iyi, ama daha iyi. Bu, konuyu vurgulamak adına sahte ve çelişkili bir örnektir. Altta yatan sorun da 5 üzerinden 2'yi kullanmak olabilir.
gung - Reinstate Monica

1
Soru şu: Çözümler iç içe olmadığından, hangi yaklaşım her katılımcının gizli değişken üzerindeki puanına ilişkin daha iyi bir tahmin sağlar & neden? Sadece 1 taraflı mı, gerçek değerden mi yoksa her ikisinden de mi farklı? Bu sadece 1'i kullanmak "yetersiz" olduğu için olur mu? Bu tam olarak ne anlama geliyor? Bozulmanın doğasını karakterize etmek mümkün mü? Alternatif olarak, sadece 1 çıkarmanın analizin tüm serbestlik derecelerini birinci olabildiğince doğru hale getirmesine odaklanmasını bekleyebilirdim.
gung - Monica'yı eski

Yanıtlar:


5

Bahsettiğiniz konu, 80'lerde literatürde biraz tartışılan psikolojik test araçları oluştururken 'yaklaşık tek boyutluluk' konusudur. İlham geçmişte vardı, çünkü uygulayıcılar öğeleri için geleneksel madde tepki teorisi (IRT) modellerini kullanmak istediler ve o zaman bu IRT modelleri sadece tek boyutlu özellikleri ölçmekle sınırlıydı. Bu nedenle, test çokboyutluluğunun (umarım) önlenebileceği veya göz ardı edilebileceği bir sıkıntı olması umuluyordu. Bu aynı zamanda faktör analizinde paralel analiz tekniklerinin oluşturulmasına (Drasgow ve Parsons, 1983) ve DETECT yöntemlerine yol açan şeydir.

Yanlış modeli verilere açıkça uydurmak dışında ek özellikleri / faktörleri göz ardı etmenin sonuçları (yani, potansiyel model uyumsuzluğu hakkındaki bilgileri göz ardı etmek; tabii ki önemsiz olsa da), baskın faktör hakkındaki özellik tahminlerinin taraflı olması ve dolayısıyla daha az verimlidir. Bu sonuçlar elbette ek özelliklerin özelliklerinin (örneğin, birincil boyutla ilişkili olup olmadıklarına, güçlü yüklere sahip olup olmadıklarına, kaç tane çapraz yüklemenin bulunduğuna vb.) Bağlıdır, ancak genel tema, ikincil tahminlerin birincil özellik puanları elde etmek için daha az etkili olacaktır. Teknik rapor bakın burada bir bayan takılan tek boyutlu modeli yerine iki faktör modeli arasında bir karşılaştırma için; teknik rapor tam olarak peşinde olduğunuz gibi görünüyor.

Pratik bir perspektiften, en uygun modeli seçerken ve genel olarak model uyum istatistiklerini (RMSEA, CFI, vb.) Seçerken bilgi ölçütlerini kullanmak yararlı olabilir, çünkü çok boyutlu bilgileri göz ardı etmenin sonuçları verilere genel uyumu olumsuz etkileyecektir. . Ama elbette, genel model uyumu eldeki veriler için uygun olmayan bir model kullanmanın sadece bir göstergesidir; doğrusal olmama veya monotonluk eksikliği gibi uygun olmayan fonksiyonel formların kullanılması tamamen mümkündür, bu nedenle ilgili kalemler / değişkenler de her zaman denetlenmelidir.

Ayrıca bakınız :

Drasgow, F. ve Parsons, CK (1983). Tek Boyutlu Madde Tepki Teorisi Modellerinin Çok Boyutlu Verilere Uygulanması. Uygulamalı Psikolojik Ölçüm, 7 (2), 189-199.

Drasgow, F. ve Lissak, RI (1983). Modifiye paralel analiz: İki dereceli puanlanan madde yanıtlarının gizli boyutsallığını incelemek için bir prosedür. Uygulamalı Psikoloji Dergisi, 68, 363-373.

Levent Kirişçi, Tse-chi Hsu ve Lifa Yu (2001). Madde Parametresi Tahmin Programlarının Tek Boyutluluk ve Normallik Varsayımlarına Sağlamlığı. Uygulamalı Psikolojik Ölçüm, 25 (2), 146-162.


Bunu eklediğiniz için teşekkürler. Bu benim peşimde olduğum gibi görünüyor.
gung - Monica'yı eski

Başlık sorusuna verdiğiniz yanıtın "Evet" olduğunu doğru anladım mı?
amip

2
@ amoeba genellikle, evet ya da daha fazla bilgi dahil olmak üzere katı tekdüzeliklik empoze etmekten daha iyi ya da daha iyi olması gerektiğini söyleyebilirim. Bilinen çokboyutluluğun göz ardı edilmesi çok sorunlu olabilir, ancak elbette buna bir dizi faktör katkıda bulunacaktır. Yapı hakkında ek bilgiler dahil olmak üzere kötü olabilecek tek zaman, numune boyutunun fazladan parametreleri kararlı bir şekilde tahmin etmek için çok küçük olması; bu yüzden önyargılı verimlilik ödülü. Ancak, örnek boyutu fazla bir sorun değilse, o zaman ekstra bilgi dahil (ama değilse kaybedecek çok) dahil kaybedecek çok az olduğunu söyleyebilirim.
philchalmers

1

Gerçekten ikinci faktörü kullanmak istemiyorsanız, sadece tek faktörlü bir model kullanmalısınız. Ancak, ikinci bir faktör kullanırsanız, birinci faktör için yüklemelerin değişeceğine dikkatinizi çekerim.

xx

Daha sonra, dönme etkilerinin açıklaması için. Çizimde iyi değilim, bu yüzden sizi kelimeler kullanarak ikna etmeye çalışacağım. Verilerinizin (yaklaşık) normal olduğunu ve faktör puanlarının da yaklaşık normal olduğunu varsayacağım. Bir faktörü ayıklarsanız, tek boyutlu normal dağılım elde edersiniz, iki faktörü ayıklarsanız, iki değişkenli normal dağılım elde edersiniz.

İki değişkenli bir dağılımın yoğunluğu kabaca bir şapka gibi görünür, ancak kesin şekil ölçeklemeye ve korelasyon katsayısına bağlıdır. İki bileşenin birim varyansa sahip olduğunu varsayalım. İlişkisiz durumda, dairelere benzeyen seviye eğrileri ile güzel bir sombrero elde edersiniz. Burada bir resim var . Korelasyon şapka "squashes", böylece daha Napolyon şapka gibi görünüyor .

Orijinal veri kümenizin üç boyutu olduğunu ve bundan iki faktörü çıkarmak istediğinizi varsayalım. Ayrıca normalliğe bağlı kalalım. Bu durumda yoğunluk dört boyutlu bir nesnedir, ancak seviye eğrileri üç boyutludur ve en azından görselleştirilebilir. İlişkisiz durumda seviye eğrileri küreseldir (bir futbol topu gibi). Korelasyon varlığında, seviye eğrileri bir futbola, muhtemelen havalandırılmamış olana tekrar çarpılacaktır, böylece dikişlerdeki kalınlık diğer yönlerdeki kalınlıktan daha küçük olacaktır.

PCA kullanarak iki faktör çıkarırsanız, futbolu bir elips şeklinde tamamen düzleştirirsiniz (ve her veri noktasını elips düzlemine yansıtırsınız). Döndürülmemiş birinci faktör, elipsin uzun eksenine karşılık gelir, ikinci faktör ona diktir (yani kısa eksen). Rotasyon daha sonra diğer kullanışlı kriterleri yerine getirmek için bu elips içinde bir koordinat sistemi seçer .

Sadece tek bir faktör çıkarırsanız, dönüş mümkün değildir, ancak çıkarılan PCA faktörünün elipsin uzun eksenine karşılık geldiği garanti edilir.


2
Bu cevap beni şaşırttı. Soru, temel bileşen analizinin aksine faktör analizini açıkça soruyor .
amip

Faktörleri çıkarmanın iki yolu vardır: Temel bileşenler veya maksimum olasılık. Bu konuda herhangi bir istatistik yapmadım, ancak temel bileşen yönteminin daha sık kullanıldığına inanıyorum.
user3697176

3
İkiden fazla farklı yöntem vardır. Ana eksen, ML, eksi, ağırlıklı en küçük kareler ve daha fazlası - Ben burada uzman değilim. PCA belki de bazen (nadiren!) Bir faktör çıkarma yöntemi olarak kabul edilir, ancak bu oldukça özensizdir - gerçekten olmamalıdır. Farklı bir modele uyar.
amip

İlk cümlenin Q.'ya hitap ediyor. Bunun hakkında daha fazla şey duymak güzel ve neden doğru olabilir. Faktörleri ayıklama yöntemleri ile ilgili olarak, @ amip doğru: PCA ve PAF, diğer algoritmalar o kadar iyi gelişmemiş veya uygulanması zor olmadığında yaygındı. Şimdi yaygın olarak daha düşük olarak kabul edilirler. R'ler fa()örneğin onları yıllardır kullanmadı. Diğer yöntemler, yazılım ve FA veri kümesiyle doğrulanması kolay iç içe olmayan çözümler üretecektir. Karşılaştırılabilirlik uğruna, her iki çözümü de döndürülmemiş olarak düşünebilirsiniz. FWIW, küresel ve eliptik MVN dağılımları fikrini tanıyorum.
gung - Monica'yı eski

1
@ gung, bir açıklama. PAF yöntemi ayrıca iç içe olmayan çözümler de sunar. İyi bir FA yöntemidir (bir yöntem olarak PCA'ya dayanmasına rağmen) ve sanırım hala yaygın olarak kullanılmaktadır.
ttnphns

1

Neden iki model (tek boyutlu model ve EFA sonuçlarınızla hizalanmış iki boyutlu bir model) çalıştırmak için lav veya MPlus gibi bir şey kullanmıyorsunuz ve farklı modellerin göreceli ve mutlak uyum indekslerini (yani, bilgi kriterleri - AIC ve BIC, RMSEA, SRMR, CFI / TLI)? Bu yola inerseniz, EFA için PCA kullanmak istemezsiniz, daha çok ana faktörler. Ölçümle gerçekten ilgilenen biri, CFA'yı tam bir yapısal denklem modeline yerleştirecektir.

Düzenleme: Düşünmenizi istediğim yaklaşım daha çok gizli değişkenlerin aslında öğe kümesini açıklamakla ilgilidir. Daha büyük faktörün en iyi tahminini almak istiyorsanız, hangisi olursa olsun, CFA modelinden faktör puanlarını daha iyi bir şekilde kullanmak için oy verirdim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.