PCA ya da faktör analizinde çarpık değişkenler


9

22 değişkene dayalı SPSS üzerinde temel bileşen analizi (faktör analizi) yapmak istiyorum. Ancak, bazı değişkenlerim çok eğri (SPSS'den hesaplanan çarpıklık 2-80 arasında!).

Sorularım işte burada:

  1. Çarpık değişkenleri böyle tutmalı mıyım yoksa değişkenleri ana bileşen analizinde değiştirebilir miyim? Evetse, faktör puanlarını nasıl yorumlayabilirim?

  2. Ne tür bir dönüşüm yapmalıyım? log10 veya ln?

  3. Başlangıçta, KMO'm (Kaiser – Meyer – Olkin) 0.413'tür. Pek çok literatür en az 0,5 öneriyor. Yine de faktör analizi yapabilir miyim veya KMO'yu 0,5'e yükseltmek için değişkenleri kaldırmam gerekir mi?


5
Bir not: PCA, faktör analizi ile aynı değildir. PCA bir veri azaltma yöntemidir, FA gizli değişkenleri bulma girişimidir. Sıklıkla (ama her zaman değil) benzer sonuçlar verirler
Peter Flom

Yanıtlar:


9
  1. PCA'daki çarpıklık sorunu regresyondakiyle aynıdır: daha uzun kuyruk, tüm dağılım aralığına göre gerçekten uzunsa, aslında büyük bir aykırı gibi davranır - fit çizgisini (durumunuzdaki ana bileşen) güçlü bir şekilde çünkü etkisi arttı; etkisi artar çünkü ortalamadan çok uzaktır. PCA bağlamında, çok çarpık değişkenlere izin vermek, verileri ortalamaksızın PCA yapmaya benzer (yani korelasyon matrisi yerine kosinüs matrisi temelinde PCA yapmak). Öyle karar verir kim bu kadar büyük ölçüde etkisi sonuçlarına uzun kuyruk izin (ve veri olalım) olmadığını (ve verileri dönüştürmek) belirlemeyi. Sorun, yüklemelerin yorumlanmasını nasıl yaptığınızla ilgili değildir.

  2. İstediğiniz gibi.

  3. KMO, faktör analizine veri göndermek için kısmi korelasyonların makul derecede küçük olup olmadığını söyleyen bir endekstir. Çünkü faktör analizinde genellikle bir faktörün sadece iki değişkenten fazlasını yüklemesini bekliyoruz . KMO'nuz yeterince düşük. Düşük bireysel KMO değerlerine sahip analiz değişkenlerinden düşerseniz (bunlar anti-görüntü matrisinin köşegeninden oluşursa , bu matrisi SPSS Faktörü prosedüründe göstermeyi isteyebilirsiniz) daha iyi yapabilirsiniz. Değişkenleri daha az çarpık hale getirmek KMO'yu kurtarabilir mi? Kim bilir. Olabilir. KMO'nun Temel Bileşenler analiz modelinde değil, Faktör analizi modelinde önemli olduğunu unutmayın: FA'da çift korelasyonlar uyuyorsunuz, PCA'da ise yoktur.


2

+1 @ttnphns için, sadece # 2 noktasında biraz genişletmek istiyorum. Dönüşümler genellikle eğriltmeyi stabilize etmek için kullanılır. @Ttnphns'ın belirttiği gibi , analizlerinizi çalıştırmadan önce bunları kullanırsınız . Log dönüşümleri, Box-Cox güç dönüşümleri ailesinin bir parçasıdır. Yalnızca günlüklerden daha geniş bir olası dönüşüm aralığını düşünmek isteyeceksiniz (örn. Karekök, karşılıklı, vb.). Farklı logaritmik bazlar arasındaki seçimin dönüşümün gücü üzerinde hiçbir etkisi yoktur. İnsanlar dönüştürülmüş değişkenle matematiksel olarak çalışacakları zaman, doğal kütük bazı durumlarda daha temiz matematik için yapabileceği için bazen doğal günlükler tercih edilir. Bunu önemsemiyorsanız, yorumu kolaylaştıracak bir temel seçmek isteyebilirsiniz. Yani, yeni ölçekte her bir birim artış bir temeli temsil edecektir- orijinal ölçekte kat artışı (örneğin, günlük tabanı 2'yi kullandıysanız, her birim 2 kat artış olur, taban 10, her birim 10 kat artış olur, vb.), bu yüzden güzel olabilir verilerinizin dönüştürülen ölçekte birkaç birime yayılacağı bir taban seçmek için.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.