"A", "B" ve "C" ile ilgilidir. "B" ve "C" nin bu bağlamda da ilişkili olabileceğini nasıl gösterebilirim?
Örnek:
Yakın zamanda yapılan bir Broadway oyunu hakkında birkaç başlık:
- Al Mamino'nun oynadığı David Mamet'in Glengarry Glen Ross'u Broadway'de açılıyor
- 'Glengarry Glen Ross' da Al Pacino: Eleştirmenler ne düşündü?
- Al Pacino Broadway turn için cansız yorumlar kazanıyor
- Tiyatro İncelemesi: Glengarry Glen Ross Yıldızlarını Zor Satıyor
- Glengarry Glen Ross; Hey, Klieg Işıklarını Kim Öldürdü?
Sorun:
Bu kayıtlar üzerinde bulanık bir dize eşleşmesi çalıştırmak, bazı ilişkiler kuracak, ancak diğerleri değil, bir insan okuyucu bunları daha büyük veri kümelerinde bağlamdan seçebilmesine rağmen.
# 3'ün # 4 ile ilgili olduğunu gösteren ilişkiyi nasıl bulurum? Her ikisi de # 1'e kolayca bağlanabilir, ancak birbirine bağlanamaz.
Bu tür veri veya yapı için (Google ile) bir ad var mı? Ne tür bir algoritma arıyorum?
Hedef:
1.000 başlık verildiğinde, bu 5 öğenin muhtemelen aynı şeyle ilgili olduğunu otomatik olarak öneren bir sistem .
Dürüst olmak gerekirse, programladığımdan beri çok uzun zaman geçti, bu sorunu nasıl doğru bir şekilde ifade edeceğimi kaybettim. (Eğer mantıklıysa, bilmediğimi bilmiyorum).
Bu kişisel bir proje ve ben Python'da yazıyorum. Herhangi bir yardım, tavsiye ve işaretçi için şimdiden teşekkür ederiz!