Faktör analizi varsayımları nelerdir?


11

Gerçekten [klasik, doğrusal] faktör analizini (FA), özellikle FA'dan önce (ve muhtemelen sonra) yapılan varsayımları anladığımı kontrol etmek istiyorum .

Verilerin bazıları başlangıçta ilişkilendirilmelidir ve aralarında olası bir doğrusal ilişki vardır. Faktör analizi yapıldıktan sonra veriler normal olarak dağıtılır (her çift için iki değişkenli dağılım) ve faktörler (ortak ve spesifik) arasında bir korelasyon yoktur ve bir faktörden değişkenler ile diğer faktörlerden değişkenler arasında korelasyon yoktur.

Doğru mu?

Yanıtlar:


12

Doğrusal FA giriş veri varsayımları (Burada FA modelinin iç varsayımları / özellikleri hakkında veya sonuçların uyum kalitesini kontrol etmekten bahsetmiyorum ).

  1. Ölçek (aralık veya oran) giriş değişkenleri . Bu, maddelerin sürekli ölçüler olduğu veya ayrık nicel ölçekte ölçülürken sürekli olarak kavramsallaştırıldığı anlamına gelir. Doğrusal FA'da sıralı veri yok ( okuma ). İkili veriler de (bkz kaçınılmalıdır bu , bu ). Doğrusal FA, gizli ortak ve benzersiz faktörlerin sürekli olduğunu varsayar . Bu nedenle yükledikleri gözlemlenen değişkenler de sürekli olmalıdır.
  2. Korelasyonlar doğrusaldır . Doğrusal FA, herhangi bir SSCP tipi ilişkilendirme matrisine dayanarak gerçekleştirilebilir : Pearson korelasyonu, kovaryans, kosinüs, vb (ancak bazı yöntemler / uygulamalar sadece Pearson korelasyonları ile sınırlı olabilir). Bunların hepsinin lineer cebir ürünleri olduğuna dikkat edin. Kovaryans katsayısının büyüklüğünün, ilişkideki doğrusallıktan daha fazlasını yansıtmasına rağmen, doğrusal FA'daki modelleme, kovaryanslar kullanıldığında bile doğada doğrusaldır : değişkenler doğrusal faktör kombinasyonlarıdırve dolayısıyla sonuçtaki ilişkilendirmelerde doğrusallık ima edilmektedir. Doğrusal olmayan ilişkilendirmelerin geçerli olduğunu görürseniz / düşünürseniz - doğrusal FA yapmayın ya da önce verilerin bazı dönüşümleri ile doğrusallaştırmaya çalışmayın. Ve Spearman veya Kendall korelasyonları üzerinde FA doğrusal taban yok (Pt. 4 orada ).
  3. Aykırı değer yok - bu herhangi bir sağlam olmayan yöntemde olduğu gibi. Pearson korelasyonu ve benzer SSCP tipi ilişkilendirmeler aykırı değerlere duyarlıdır, bu yüzden dikkat edin.
  4. Oldukça yüksek korelasyonlar mevcuttur . FA korelasyon analizidir, - korelasyonların tümü veya neredeyse tamamı zayıf olduğunda kullanımı nedir? - faydası yok. Bununla birlikte, "makul derecede yüksek korelasyon" nedir çalışma alanına bağlıdır. Çok yüksek korelasyonların kabul edilip edilmeyeceği konusunda ilginç ve çeşitli bir soru da vardır (örneğin PCA üzerindeki etkisi burada tartışılmaktadır ). Verilerin ilişkisiz olup olmadığını istatistiksel olarak test etmek için Bartlett'in küresellik testi kullanılabilir.
  5. Kısmi korelasyonlar zayıftır ve faktör yeterince tanımlanabilir . FA, faktörlerin sadece ilişkili öğelerin yüklenmesinden daha genel olduğunu varsayar. Aslında, keşifsel FA'da 3 maddeden daha az yüklenen faktörlerin çıkarılmaması için bir tavsiye bile vardır; ve doğrulayıcı FA'da sadece 3+ garanti edilen yapıdadır. Heywood davası adı verilen teknik bir çıkarma sorunu, arkasındaki nedenlerden biri olarak, faktör üzerinde çok az öğe durumuna sahiptir. Kaiser-Meyer-Olkin ( KMO ) "örnekleme yeterlilik ölçüsü" verilerde tam korelasyonlara göre kısmi korelasyonların ne kadar zayıf olduğunu tahmin eder; her madde ve tüm korelasyon matrisi için hesaplanabilir.
  6. Çoklu bağlantı yok . FA modeli, her bir öğenin benzersiz bir faktör içerdiğini ve bu faktörlerin dikey olduğunu varsayar. Bu nedenle, 2 öğe bir düzlem, 3 öğe - bir 3d boşluk vb. Tanımlamalıdır: pilişkili vektörler, karşılıklı olarak dik benzersiz bileşenlerini karşılamak için p-dim boşluğunu kapsamalıdır. Yani, teorik nedenlerden ötürü tekillik yok (ve dolayısıyla otomatik olarak , söylemeden; ve daha iyi ). Yine de tam bir çoklu bağlantıya izin verilmez; ancak FA algoritmalarının çoğunda hesaplama sorunlarına neden olabilir ( ayrıca bkz .).1n observations > p variablesn>>p
  7. Dağıtım . Genel olarak, doğrusal FA girdi verilerinin normalliğini gerektirmez. Orta derecede çarpık dağılımlar kabul edilebilir. Bimodalite bir kontrendikasyon değildir. Normallik gerçekten modeldeki benzersiz faktörler için varsayılır (regresyon hataları olarak hizmet ederler) - ancak ortak faktörler ve giriş verileri için değil ( ayrıca bkz .). Yine de, bazı ekstraksiyon yöntemleri (yani, maksimum olasılık) ve bazı asimptotik testler yaparak verilerin çok değişkenli normalliği ek varsayım olarak gerekli olabilir.

1 ULS / minres FA yöntemleri tekil ve hatta psd olmayan korelasyon matrisi ile çalışabilir, ancak kesinlikle teorik olarak böyle bir analiz benim için şüphelidir.


, bu yazıyı okuyabilir misin , biraz farklı görünüyordu.
WhiteGirl

Eğer Binary data should also be avoidedbaşka hangi faktör analizi yöntemini yapabiliriz binary data?
kittygirl

sevgili ttnphns; Verilerin normal kabul edildiğinden bahsetmediğinizi fark ediyorum ve diğer çevrimiçi normallik gerekmediğini gösteriyor. Benim sorgum, gizli değişkenlerin normal kabul edilmesi ve gözlemlerin faktörlerin ağırlıklı toplamı olarak modellenmesi, bu gözlemler üzerinde normal bir dağılım anlamına gelmiyor mu? (Üzgünüm, bu aptalca bir soru olduğundan eminim)
user2957945

@ user2957945, Paragraf 7 normallik hakkında diyor. Bazı faktör ekstraksiyon yöntemleri ve fakültatif olarak eşlik eden faktör analizinde bazı istatistiksel testlerin gerçekleştirilmesi için normallik varsayımı gereklidir. Sorunuza göre: Evet, eğer faktörler normal dağıtılırsa ve hatalar da normalse, bu durum değişken değişkenlerin de normal olduğu anlamına gelir.
ttnphns

ah, teşekkürler @ttnphns; rahatsız ettiğim için özür dilerim - bunu nasıl özleyebileceğimi bilmiyorum. Yardımınıza minnettar olurum.
user2957945

9

Çoğu zaman faktör analizi, herhangi bir istatistiksel test yapılmadan gerçekleştirilir. Regresyon, yapısal eşitlik modellemesi vb. Yöntemlerden çok daha öznel ve yorumlayıcıdır. Ve genellikle varsayımlarla gelen çıkarımsal testlerdir: p değerlerinin ve güven aralıklarının doğru olması için bu varsayımların karşılanması gerekir.

Şimdi, faktör sayısını seçme yöntemi maksimum olabilirlik yöntemi olarak ayarlanmışsa, bununla ilgili bir varsayım vardır: faktör analizine giren değişkenlerin normal dağılımlara sahip olacağı.

Girdi değişkenlerinin sıfır olmayan korelasyonlara sahip olması, doğru olmadan faktör analizi sonuçlarının (muhtemelen) yararsız olacağı bir tür varsayımdır: bazı girdi değişkenleri kümesinin ardındaki gizli değişken olarak hiçbir faktör ortaya çıkmayacaktır.

"Faktörler (ortak ve spesifik özellikler) arasında bir korelasyon ve bir faktördeki değişkenler ile diğer faktörlerden değişkenler arasında bir korelasyon olmadığı sürece" bunlar, faktör analistlerinin zaman zaman her iki koşulda (veya bir yaklaşımda) yaptığı evrensel kabuller değildir. istenebilir). İkincisi, tutarken, "basit yapı" olarak bilinir.

Bazen bir "varsayım" olarak ele alınan başka bir durum daha vardır: girdi değişkenleri arasındaki sıfır mertebe (vanilya) korelasyonlarının büyük kısmi korelasyonlarla batak olmaması. Kısaca bunun anlamı, ilişkilerin bazı eşlemeler için güçlü, bazıları için zayıf olması; aksi takdirde sonuçlar "çamurlu" olacaktır. Bu, basit yapının arzu edilebilirliği ile ilgilidir ve aslında Kaiser-Meyer-Olkin istatistiği veya KMO kullanılarak değerlendirilebilir (resmi olarak "test edilmese de"). .8 veya .9'a yakın KMO değerlerinin bilgilendirici faktör analizi sonuçları için genellikle çok umut verici olduğu düşünülürken, .5 veya .6'ya yakın KMO'lar çok daha az umut vericidir ve .5'in altındaki değerler bir analistin stratejisini yeniden düşünmesini isteyebilir.


Okuduğumda, bu faktör analizi değişkenlerle bazı korelasyonlarla başlar ve bu korelasyonu gittikçe daha açık hale getirmeye çalışırız
Sihem

1
Faktör analizi uygulandıktan sonra, eğer ortogonal rotasyon kullandıysak, faktörler arasında bir korelasyon olmadığından emin olacağız
Sihem

2

Faktör analizi temel varsayımlar şunlardır:
• aralığı veya ölçüm oranı düzeyi
Rastgele örnekleme •
lineer gözlenen değişkenler arasındaki İlişki •
• bir normal dağılım (her gözlenen değişken)
• Bir iki değişkenli normal dağılım (gözlenen değişkenlerin her biri çift)
• Çok değişkenli normalite
yukarıda SAS dosyası

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.