Daha yüksek dereceli sistemlerin boyutsallığını azaltmak ve kovaryansın çoğunu tercihen 2 boyutlu veya 1 boyutlu bir alanda yakalamak istiyorum. Bunun ana bileşen analizi yoluyla yapılabileceğini biliyorum ve PCA'yı birçok senaryoda kullandım. Ancak, onu hiçbir zaman boolean veri türleriyle kullanmadım ve PCA'yı bu setle yapmanın anlamlı olup olmadığını merak ediyordum. Örneğin, nitel veya açıklayıcı ölçütlerim varmış gibi davranın ve bu metrik bu boyut için geçerliyse bir "1" ve eğer değilse (ikili veri) "0" atayım. Örneğin, Pamuk Prenses'teki Yedi Cüceyi karşılaştırmaya çalışıyormuş gibi yapın. Sahibiz:
Doc, Dopey, Bashful, Huysuz, Sneezy, Uykulu ve Mutlu, ve onları nitelikleri temel alarak düzenlemek istersiniz ve aynısını yapın:
Mesela Bashful, A onuruna değil, laktoz intoleransıdır. Bu tamamen varsayımsal bir matris ve gerçek matrisimde daha birçok tanımlayıcı sütun olacak. Sorum şu ki, bireyler arasındaki benzerliği bulmak için bu matris üzerinde PCA yapmak uygun olur mu?
a means of finding the similarity between individuals
. Ancak bu görev PCA için değil Küme analizi içindir.