Boolean (yani, iki sınıfla kategorik) özellikler için, PCA'yı kullanmanın iyi bir alternatifi, sadece PCA'nın kategorik değişkenlere genişletilmesi olan Çoklu Yazışma Analizi'nin (MCA) kullanılmasından oluşur (ilgili konuya bakın ). MCA hakkında arka plan için, yazılar Husson ve ark. (2010) veya Abdi ve Valentin (2007) . MCA gerçekleştirmek için mükemmel bir R paketi FactoMineR'dir . Çok içgörüsel olan gözlemlerin temel bileşenler üzerindeki yüklemelerinin iki boyutlu haritalarını çizmek için araçlar sağlar.
Aşağıda, geçmiş araştırma projelerimden birinden iki harita örneği verilmiştir (ggplot2 ile çizilmiştir). Sadece 60 gözlemim vardı ve bu iyi sonuçlar verdi. İlk harita PC1-PC2 uzayındaki gözlemleri, PC3-PC4 uzayındaki ikinci haritayı temsil eder ... Değişkenler harita üzerinde de temsil edilir ve boyutların anlamının yorumlanmasına yardımcı olur. Bu haritaların birkaçından içgörü toplamak, verilerinizde neler olduğuna dair size güzel bir resim verebilir.
Yukarıda bağlantılı web sitesinde ayrıca, Temel Bileşenler Üzerinde Hiyerarşik Kümeleme anlamına gelen ve ilginizi çekebilecek yeni bir prosedür olan HCPC hakkında bilgi bulacaksınız. Temel olarak, bu yöntem aşağıdaki gibi çalışır:
- bir MCA gerçekleştirin,
- ilk boyutlarını koruyun (burada , orijinal özellik ). Bu adım, biraz gürültüyü ortadan kaldırması ve dolayısıyla daha kararlı bir kümelenmeye izin vermesi açısından yararlıdır,kk<pp
- tutulan bilgisayarların alanında aglomeratif (aşağıdan yukarıya) hiyerarşik bir kümeleme gerçekleştirin. PC alanındaki gözlemlerin projeksiyonlarının koordinatlarını kullandığınızdan (gerçek sayılar), Ward'ın bağlantı kriterini (küme içi varyansındaki minimum artış) Öklid mesafesini kullanabilirsiniz. Dendogramı istediğiniz yükseklikte kesebilir veya bazı sezgisel taramaya dayanırsanız R fonksiyonunun kesilmesine izin verebilirsiniz,
- (isteğe bağlı) bir K-ortalama kümeleme gerçekleştirerek kümeleri stabilize eder. İlk yapılandırma, önceki adımda bulunan kümelerin merkezleri tarafından verilir.
Ardından, kümeleri araştırmanın birçok yolu vardır (çoğu temsili özellik, çoğu temsili birey, vb.)