Bu doğru yığın sitesi olup olmadığından emin değilsiniz, ama işte gidiyor.
.Similiarity yöntemi nasıl çalışır?
Vay canına, harika! Onun tfidf modeli daha kolay olabilir, ama sadece bir kod satırı ile w2v ?!
Onun içinde Spacy 10 hat öğretici andrazhribernik gösterisi bize jeton, rak yüzlerce, kelime parçaları ve dokümanlar üzerinde çalıştırılabilir .similarity yöntemi bu.
Sonra nlp = spacy.load('en')
ve doc = nlp(raw_text)
belirteçler ve parçalar arasında benzerlik sorguları yapabiliriz. Ancak, bu .similarity
yöntemde perde arkasında ne hesaplanıyor ?
SpaCy .vector
, w2v vektörünü GloVe modelinden eğitildiği gibi hesaplayan inanılmaz derecede basittir (a .tfidf
veya .fasttext
yöntem ne kadar havalı olurdu ?).
Model sadece bu iki w2v, .vector, vektörler arasındaki kosinüs benzerliğini mi hesaplıyor yoksa başka bir matrisi mi karşılaştırıyor? Ayrıntılar dokümantasyonda net değil ; herhangi bir yardım takdir!