Çok sayıda cümleyi anlamlarına göre gruplara ayırma problemim var. Bu, çok sayıda cümleniz olduğunda ve anlamlarına göre gruplandırmak istediğinizde bir soruna benzer.
Bunu yapmak için hangi algoritmalar öneriliyor? Önceden kümelerin sayısını bilmiyorum (ve daha fazla veri geliyor gibi kümeler de değişebilir), normalde her cümleyi temsil etmek için hangi özellikler kullanılır?
Şimdi sadece kelime listesi ve cümleler olarak tanımlanan cümleler arasındaki mesafe ile en basit özellikleri deniyorum:
(A ve B, A ve B cümlesindeki karşılık gelen kelime kümeleridir)
Hiç mantıklı mı?
Önceden küme sayısı gerektirmediği için scikit kütüphanesinden Mean-Shift algoritmasını bu mesafeye uygulamaya çalışıyorum .
Herhangi biri sorun için daha iyi yöntemler / yaklaşımlar önerecekse - konu hakkında hala yeni olduğum için çok takdir edilecektir.