Word2vec algoritmalarının her ikisine de dayalı olduğunu söyleyebilirim.
İnsanlar derken distributional representation
, genellikle dilsel yönü ifade ederler: anlam bağlamdır, kelimeyi şirketi ve diğer ünlü alıntılarla bilin.
Fakat insanlar derken distributed representation
, çoğunlukla dilbilim ile ilgisi yoktur. Daha çok bilgisayar bilimi yönü ile ilgilidir. Mikolov'u ve diğerlerini doğru anlarsam distributed
, makalelerindeki kelime
, bir vektör temsilinin her bir bileşeninin kendine ait bir anlamı olmadığı anlamına gelir. Yorumlanabilir özellikler (örneğin, word2vec durumunda kelime bağlamları) gizlenir vedistributed
yorumlanamayan vektör bileşenleri arasındadır: her bileşen yorumlanabilir birkaç özellikten sorumludur ve yorumlanabilir her özellik birkaç bileşene bağlıdır.
Bu nedenle, word2vec (ve doc2vec), sözcüksel anlambilimi temsil etmenin bir yolu olarak teknik olarak dağıtılmış gösterimleri kullanır. Aynı zamanda kavramsal olarak dağılımsal hipoteze dayanır: sadece dağıtım hipotezi doğru olduğu için çalışır (kelime anlamları tipik bağlamlarıyla ilişkilidir).
Ama tabii ki genellikle terimler distributed
ve distributional
birbirlerinin yerine kullanılır, yanlış anlama artar :)