Birkaç dağıtımım var (aşağıdaki şekilde 10 dağıtım).
Aslında bunlar histogramlardır: x ekseni üzerinde bir çözeltideki bazı parçacıkların boyutları olan 70 değer vardır ve her x değeri için karşılık gelen y değeri, boyutu x değeri civarında olan parçacıkların oranıdır.
Bu dağılımları kümelemek istiyorum. Şu anda örneğin Öklid mesafesiyle hiyerarşik bir kümeleme kullanıyorum. Mesafe seçiminden memnun değilim. Kullback-Leibler gibi bilgi-kuramsal mesafeyi denedim ancak verilerde çok sayıda sıfır var ve bu da zorluklara neden oluyor. Uygun bir mesafe ve / veya başka bir kümeleme yöntemi önerisi var mı?