Bir küme analizi yapabilmek için değişken sayısını azaltmalıyım. Değişkenlerim güçlü bir şekilde ilişkilidir, bu yüzden bir Faktör Analizi PCA (temel bileşen analizi) yapmayı düşündüm . Ancak, elde edilen puanları kullanırsam, kümelerim tam olarak doğru değildir (literatürdeki önceki sınıflandırmalara kıyasla).
Soru:
Her bileşen / faktör için en büyük yüke sahip değişkenleri seçmek için rotasyon matrisini kullanabilir ve kümeleme için yalnızca bu değişkenleri kullanabilir miyim?
Herhangi bir bibliyografik referans da faydalı olacaktır.
Güncelleme:
Bazı açıklamalar:
Amacım: SPSS tarafından iki aşamalı algoritma ile bir küme analizi yapmak zorundayım, ancak değişkenlerim bağımsız değil, bu yüzden bazılarını atmayı düşündüm.
Veri setim: 100.000 vakanın 15 skaler parametresi (değişkenlerim) üzerinde çalışıyorum. Bazı değişkenler güçlü bir şekilde ilişkilidir ( Pearson)
Şüphem: Sadece bağımsız değişkenlere ihtiyacım olduğu için, bir Temel Bileşen Analizi çalıştırmayı düşündüm (üzgünüm: orijinal sorum, yanlışımdaki Faktör Analizi hakkında yanlış konuştum) ve sadece her bileşen için en büyük yükleri olan değişkenleri seçtim. PCA sürecinin bazı keyfi adımlar sunduğunu biliyorum, ancak bu seçimin aslında IT Jolliffe (1972 ve 2002) tarafından değişkenleri seçmek için önerilen ve 1999'da JR King ve DA Jackson tarafından önerilen " yöntem B4 " ile benzer olduğunu öğrendim .
Bu yüzden bağımsız değişkenlerin bazı alt gruplarını seçmeyi düşünüyordum. Daha sonra grupları farklı küme analizi yapmak için kullanacağım ve sonuçları karşılaştıracağım.