Bir Setten Benzer Öğeleri Eşleştirme


10

Eşyaları eşleştirmeye çalışıyorum. Bir dizi öğesi göz önüne alındığında , 0 ile 100 arasında bir skalaya benzerlik gösterebilirim. Örneğin, n 1 maddesi süt ve n 2 maddesi de sütse, n 1 ve n 2 arasındaki benzerlik % 100 olacaktır. Eğer n, 3 soda, sonra arasındaki benzerlik , n , 1 ve n, 3 böylece belki de% 80 olur, ve.nn1n2n1n2n3n1n3

öğeyi benzer öğelerin gruplarına nasıl gruplandıracağımı anlamaya çalışıyorum , ancak bu zor bir sorun. Aşağıdaki sorunla karşılaşıyorum: At, bir keçiye benzeyen bir ineğe benzer, kısmen de keçi peynirine benzer, peynire benzer, krakerlerle ilişkili. Ancak, bir atın kraker ile aynı grupta olmasını beklemezdim. Her öğe çift olarak ilişkili olabilir, ancak başlangıç ​​ve bitiş olmayabilir.n

Herhangi bir fikir?


Evrimsel biyolojide, bu tür çift kümelenmenin sonuçlarına filogentik ağaçlar denir , bu yüzden bunu yararlı arama terimleri kümenize ekleyebilirsiniz.
hardmath

Yanıtlar:


7

Burada yapmak istediğiniz şey, benzer özellikler sergileyen K kümelerine N bölme gözlemleridir. Buna kümeleme denir ve burada daha fazla bilgi bulabilirsiniz .

Zaten sayısal bir benzerlik ölçümünüz olduğundan, bu birkaç adımda çalıştığınız K-Means algoritmasını kullanmayı düşündürüyor :

  • Küme sentroidlerini rastgele başlat
  • Her bir gözlemi en yakın sentroide karşılık gelen kümeye atayın.
  • Küme içindeki elementlerin yeni ortalaması olarak sentroidleri güncelleyin.

Merkezlerin hareket etmeyi durdurduklarında veya belirli bir eşik içinde yakınsama olup olmadığını kontrol edebilirsiniz.

Bu, her kümedeki öğelerin bir şekilde ilişkili olmasını sağlar ve algoritmadaki ("K") kümelerin sayısını artırarak daha ince taneli kümelere sahip olabilirsiniz. Küme sayısını bulmak her soruna bağlıdır ve sorunlarınız için bir grup değer denemenizi, birlikte neyin birlikte gruplandığına bakmanızı ve neyin anlamlı olduğunu görmenizi öneririm.

Umarım yardımcı olur.


5

Aradığın şeyin "küme analizi" veya "kümeleme" olduğunu düşünüyorum. Birçok farklı algoritma vardır. Sizin durumunuzda, bazı "bağlantı kümelemesi", yani her birini birbirine bağlayan bir özelliğe dayalı olarak öğeleri bir arada gruplamak istersiniz.

Scikits.learn (Python kodu) içindeki kümeleme algoritmalarına ve burada belirtilen referanslara bir göz atın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.