Belirli bir metin dizesi ve tüm alt dizeleri kabul eden bir döngüsel sonlu durum otomatı üreten bir desen eşleme algoritması ile çalışıyorum. FSA algoritması bir müzik akışının sembolik bir temsili üzerinde yürütülmektedir (örneğin, MIDI verileri). Müzik akışı, her şarkıyı etiketlenmemiş 'bölümlere' bölmek için önceden işlenmiştir. Her şarkıdaki her bölüm için bir FSA oluşturulur: her biri bölüme ayrılmış şarkım varsa , ayrı FSA'm olur.n ⋅ y
Her bir segmentin ÖSO'sunu şirketimdeki diğer ÖSO'larla karşılaştırmak istiyorum. Nihai amaç, benzerlik alanı içinde kümeleme yapmak ve inşaat metriklerinin ne kadar benzer olduğuna göre segmentlerin “sınıflarını” bulmak olacaktır. Bu nedenle, her bir FSA'nın tanımladığı dilbilgileri (segmentteki müzik içeriğinin kabaca belirli bileşenlerine karşılık gelir) özellikle ilgi çekicidir. Böyle bir şeyi karşılaştırmak için iyi olabilecek teknikler var mı? KL-diverjans akla geliyor (örneğin, belirli bir FSA ile ilişkili dizeler arasındaki dağılımı karşılaştırmak), ancak daha iyi / daha verimli teknikler olabilir mi?
Ayrıca, bu sorunun (1) önemsiz derecede kolay veya (2) daha derin bir yanlış anlaşılmanın göstergesi veya (3) başka bir yerde cevaplanması durumunda özür dileriz. Ben gerçek bir çıkarım, millet!