Yanlış soruyu soruyorsun.
"Hangi algoritmayı" sormak yerine " uygulamanızda anlamlı bir kategori / küme nedir" sorusunu sormalısınız .
Yukarıdaki algoritmaların işe yaramadığına şaşırmadım - çok farklı kullanım durumları için tasarlanmıştır. k-ortalamalar yapar değil keyfi başka mesafelerde çalışır. Hamming mesafesiyle kullanmayın. Bunun k- anlamına gelmesinin bir nedeni vardır, sadece aritmetik ortalama anlamlı olduğunda kullanmak mantıklıdır (ki bu ikili veri için değildir).
Bunun yerine k-modlarını denemek isteyebilirsiniz, IIRC bu aslında kategorik verilerle kullanılması gereken bir varyanttır ve ikili veriler biraz kategoriktir (ancak sparisite sizi hala öldürebilir).
Ancak her şeyden önce, verilerinizi basitleştirmek için kopyaları kaldırdınız ve örneğin benzersiz / boş sütunları kaldırdınız mı?
Belki APRIORI veya benzeri yaklaşımlar da probleminiz için daha anlamlı.
Her iki durumda da, önce neye ihtiyacınız olduğunu, ardından hangi algoritmanın bu zorluğu çözebileceğini bulun. Rasgele algoritmalar deneyerek değil, veri odaklı çalışın .