«word2vec» etiketlenmiş sorular

word2vec, metni işlemek için iki katmanlı bir sinir ağıdır. Kelimeleri girdi olarak alır ve buna göre bir vektör çıkarır. Continuous Bag of Word ve skipgram modeli uygulamasının bir kombinasyonunu kullanır.

4
Kelimelerin anlambilimsel benzerliğini nasıl ölçebilirim?
Kelimelerin anlambilimsel benzerliğini bulmanın en iyi yolu nedir? Word2Vec iyidir, ancak ideal değildir: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # Cold is much closer to …

5
Cümle benzerliği için en iyi pratik algoritma
İki cümleyim var, S1 ve S2. Uygulanması muhtemelen kolay olan en pratik ve başarılı (makine öğrenimi) algoritmaları nelerdir (mimari Google Inception gibi karmaşık olmadığı sürece sinir ağı tamamdır). Çok fazla zaman harcamadan iyi çalışacak bir algoritma arıyorum. Başarılı ve kullanımı kolay bulduğunuz herhangi bir algoritma var mı? Bu, kümelenme kategorisine …

2
Doc2Vec - Paragraflar nasıl etiketlenir (gensim)
Ben gensim doc2vec ile cümleler / paragraflar / belgeleri nasıl etiketlemek (etiket) merak ediyorum - pratik bir bakış açısından. Her cümlenin / paragrafın / belgenin kendine özgü etiketi (örneğin "Sent_123") olması gerekiyor mu? "Hangi sözcüklerin veya cümlelerin" Sent_123 "etiketli tek bir cümleyle en çok benzediğini söylemek istiyorsanız bu yararlı görünüyor. …

5
deniz dibi ısı haritasını büyüt
corr()Orijinal bir df dışında bir df oluşturun . corr()Df 70 X 70 çıktı ve ısı haritası görselleştirmek mümkün değildir ... sns.heatmap(df). Göstermeye çalışırsam corr = df.corr(), tablo ekrana sığmaz ve tüm korelasyonları görebilirim. Boyutundan dfbağımsız olarak tümünü yazdırmanın veya ısı haritasının boyutunu kontrol etmenin bir yolu var mı ?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

4
Önceden eğitilmiş model ağırlıklarıyla yeni bir word2vec modeli nasıl başlatılır?
Word2vector modelini kullanmak ve eğitmek için Python'da Gensim Kütüphanesi kullanıyorum. Son zamanlarda, model ağırlıklarımı (GoogleNewDataset önceden eğitilmiş modeli) gibi önceden eğitilmiş word2vec modelleriyle başlatmaya bakıyordum. Birkaç haftadır bununla mücadele ediyorum. Şimdi, gesim'de, modelimin ağırlıklarını önceden eğitilmiş model ağırlıklarıyla başlatmama yardımcı olabilecek bir işlev olduğunu araştırdım. Bu aşağıda belirtilmiştir: reset_from(other_model) Borrow …

4
Gensim Word2Vec uygulamasındaki dönem sayısı
Word2Vec uygulamasında bir iterparametre vargensim class gensim.models.word2vec.Word2Vec (cümleler = Yok, boyut = 100, alfa = 0.025, pencere = 5, min_count = 5, max_vocab_size = Yok, örnek = 0, tohum = 1, işçiler = 1, min_alpha = 0.0001, sg = 1, hs = 1, negatif = 0, cbow_mean = 0, hashfxn …

4
Bir word2vec modeli eğitirken transfer öğrenimini kullanmaktan yararlanabilir miyiz?
Google Haberler verileri vb. Gibi önceden eğitilmiş bir modelin önceden eğitilmiş ağırlıklarını bulmak istiyorum. Kendim için yeterli miktarda (10 GB vb.) Veri içeren yeni bir model geliştirmeyi zor buldum. Bu nedenle, önceden eğitilmiş katman ağırlıkları alabileceğim ve bu ağırlıkları alan adına özgü kelimelerim üzerinde yeniden eğitebileceğim transfer öğreniminden yararlanmak istiyorum. …

2
Evrişimli sinir ağı kullanarak belge sınıflandırması
Belgeleri sınıflandırmak için CNN (evriyal sinir ağı) kullanmaya çalışıyorum. Kısa metin / cümleler için CNN birçok makalede incelenmiştir. Ancak, hiçbir makalede uzun metin veya belge için CNN kullanılmamıştır. Benim sorunum, bir belgede çok fazla özellik olması. Veri kümemde her belgede 1000'den fazla simge / kelime var. Her örneği bir CNN'ye …

3
Word2Vec ve Doc2Vec hem dağıtım gösterimi hem de dağıtım gösterimi midir?
Dağılım gösteriminin benzer bağlamda ortaya çıkan kelimelerin benzer anlamlara sahip olma eğiliminde olduğu dağılım hipotezine dayandığını okudum. Word2Vec ve Doc2Vec'in her ikisi de bu hipoteze göre modellenmiştir. Ama, orijinal kağıt, hatta başlıklı edilir Distributed representation of words and phrasesve Distributed representation of sentences and documents. Yani, bu algoritmalar dağılımsal temsile …

2
Word2vec'deki özellik matrisi nedir?
Sinir ağlarında yeni başlayan biriyim ve şu anda word2vec modelini araştırıyorum. Ancak özellik matrisinin tam olarak ne olduğunu anlamak için zor zamanlar geçiriyorum. İlk matrisin belirli bir kelime için bir sıcak kodlama vektörü olduğunu anlayabilirim, ancak ikinci matris ne anlama geliyor? Daha spesifik olarak, bu değerlerin her biri (yani 17, …

2
Word2vec'deki sözcük vektörlerinin özellikleri
Duygu analizi yapmaya çalışıyorum. Kelimeleri sözcük vektörlerine dönüştürmek için word2vec modelini kullanıyorum. 'Cümleler' adlı bir listedeki tüm cümleleri kullandığımı ve bu cümleleri aşağıdaki gibi word2vec'e geçirdiğimi varsayalım: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Kelime vektörleri için çaylak olduğum için iki şüphem var. 1- Özellik sayısının 300 olarak …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.