Yanıtlar:
İsimler oldukça basittir ve size vektör gösterimleri hakkında net bir fikir vermelidir.
Word2Vec Algoritması, kelimelerin dağıtılmış anlamsal temsilini oluşturur. Eğitime iki temel yaklaşım vardır: Dağıtılmış Kelime Torbası ve Atlama gram modeli. Biri orta kelimeyi kullanarak bağlam kelimelerini tahmin etmeyi, diğeri ise bağlam kelimelerini kullanarak kelimeyi tahmin etmeyi içerir. Sen Mikolov en çok ayrıntılı olarak bu konuda bilgi edinebilir kağıt .
Aynı fikir, kelimeler için özellik temsillerini öğrenmek yerine, cümleler veya belgeler için öğreneceğiniz cümlelere ve belgelerin tamamına genişletilebilir. Bununla birlikte, bir genel Cümle Bilgisi hakkında fikir edinmek için, bunu cümledeki tüm kelimelerin vektör temsili matematiksel ortalaması olarak düşünün. Sadece ortalamayı alarak ve herhangi bir TranslationToVec eğitimi almadan çok iyi bir yaklaşım elde edebilirsiniz, ancak elbette sınırlamaları vardır.
Doc2Vec, TranslationToVec veya daha çok Word2Vec fikrini genişletir, çünkü cümleler de belge olarak kabul edilebilir. Eğitim fikri benzerliğini koruyor. Daha fazla bilgi için Mikolov'un Doc2Vec belgesini okuyabilirsiniz .
Uygulamalara gelmek, göreve bağlı olacaktır. Bir Word2Vec, sözcükler arasındaki anlamsal ilişkileri etkili bir şekilde yakalar, böylece kelime benzerliklerini hesaplamak için kullanılabilir veya duyarlılık analizi vb. Gibi çeşitli NLP görevlerine özellik olarak beslenebilir. sadece kelimeler değil. Örneğin, anlamaya çalışıyorsanız, iki yığın taşma sorusunun birbirinin kopyası olup olmadığı.
Basit bir google araması sizi bu algoritmaların bir dizi uygulamasına yönlendirecektir.