Veri kümemizde anlamsal bir arama yapmak istediğimiz yeri çözmeye çalıştığımız bir sorun var, yani alan adına özgü verilerimiz var (örnek: otomobiller hakkında konuşan cümleler)
Verilerimiz sadece bir grup cümle ve istediğimiz şey bir cümle vermek ve şu cümleleri geri almaktır:
- Bu ifadeye benzer
- Cümlenin ifadeye benzeyen bir kısmı vardır
- Bağlamsal olarak benzer anlamları olan bir cümle
Size bir örnek vermeye çalışayım, "Satın Alma Deneyimi" ifadesini aradığımı varsayalım, şu cümleleri almalıyım:
- Araba alımının imzalanması ve satın alınması 30 dakikadan daha az zaman alabileceğini hiç düşünmemiştim.
Beğendiğim bir araba buldum ve satın alma işlemi
basit ve kolaydıAraba alışverişinden kesinlikle nefret ettim ama bugün yaptığım için memnunum
Sadece kaba kuvvetli bir kelime araştırması değil
, bağlamsal benzerlik aradığımız gerçeğine vurgu yapmak istiyorum .
Eğer cümle farklı kelimeler kullanıyorsa, o zaman da onu bulabilmelidir.
Daha önce denediğimiz şeyler:
Açık Semantik Arama Burada karşılaştığımız sorun, sahip olduğumuz verilerden ontoloji üretmektir veya bu uğruna ilgimiz olan farklı alanlardan mevcut ontoloji aramaktır.
Elastik Arama (BM25 + Vektörler (tf-idf)), bunu birkaç cümle verdiğinde denedik, ancak hassasiyet o kadar da büyük değildi. Doğruluk da kötüydü. İnsan tarafından oluşturulmuş bir veri kümesine karşı denedik, sadece cümlelerin yaklaşık% 10'unu alabildi.
Cümle transformatörlerinde bir zamanlar gibi farklı düğünleri denedik ve örneği gözden geçirdik ve insan tarafından oluşturulan setimize karşı değerlendirmeyi denedik ve bu da çok düşük bir doğruluğa sahipti.
ELMO'yu denedik . Bu beklediğimizden daha iyi ama yine de daha düşük doğruluktu ve aşağıda kosinüs değerine karar vermemiz gereken bilişsel bir yük var. Bu, 3. maddeye bile uygulanır.
Herhangi bir yardım takdir edilecektir. Şimdiden yardım için çok teşekkürler