«nltk» etiketlenmiş sorular

Natural Language Toolkit, hesaplamalı dilbilim için bir Python kitaplığıdır.

7
“Entropi ve bilgi kazancı” nedir?
Bu kitabı ( NLTK ) okuyorum ve kafa karıştırıcı. Entropi şu şekilde tanımlanır : Entropi, her etiketin olasılığının, aynı etiketin günlük olasılığının çarpımının toplamıdır Metin madenciliği açısından entropi ve maksimum entropiyi nasıl uygulayabilirim ? Birisi bana kolay ve basit bir örnek verebilir mi (görsel)?

15
English.pickle nltk.data.load ile yüklenemedi
punktBelirteç yüklemeye çalışırken ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a LookupErroryükseltildi: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - 'E:\\nltk_data' > - 'E:\\Python26\\nltk_data' > - …
144 python  jenkins  nltk 


15
python'da n-gram, dört, beş, altı gram?
Bir metni n-gramlara bölmenin bir yolunu arıyorum. Normalde şöyle bir şey yapardım: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Nltk'nin yalnızca bigramlar ve trigramlar sunduğunun farkındayım, ancak metnimi dört gram, beş gram ve hatta yüz gram olarak …
137 python  string  nltk  n-gram 

9
Python ile bir kelimenin İngilizce bir kelime olup olmadığı nasıl kontrol edilir?
İngilizce sözlükte bir kelime olup olmadığını kontrol etmek istiyorum bir Python programı. Nltk wordnet arayüzünün gidecek yol olabileceğine inanıyorum, ancak bu kadar basit bir görev için nasıl kullanılacağına dair hiçbir fikrim yok. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) Gelecekte, bir kelimenin tekil biçiminin sözlükte olup olmadığını …
134 python  nltk  wordnet 


11
NLTK belirteç kullanarak noktalama işaretlerinden nasıl kurtulurum?
NLTK kullanmaya yeni başlıyorum ve metinden bir kelime listesini nasıl alacağımı tam olarak anlamıyorum. Kullanırsam nltk.word_tokenize(), bir kelime ve noktalama işareti listesi alırım. Bunun yerine sadece kelimelere ihtiyacım var. Noktalama işaretlerinden nasıl kurtulabilirim? Ayrıca word_tokenizebirden fazla cümlede çalışmaz: Son kelimeye noktalar eklenir.
125 python  nlp  tokenize  nltk 

12
Nltk veya python kullanarak durdurma kelimeleri nasıl kaldırılır
Bu yüzden, durdurulan kelimelerin kullanımını kaldırmak istediğim bir veri kümem var stopwords.words('english') Bunu sadece bu kelimeleri çıkarmak için kodum içinde nasıl kullanacağım konusunda mücadele ediyorum. Bu veri setindeki kelimelerin bir listesi zaten var, uğraştığım kısım bu listeyle karşılaştırmak ve durdurma kelimelerini kaldırmak. Herhangi bir yardım takdir edilmektedir.
110 python  nltk  stop-words 

7
nltk, scikit'in hangi sürümünün yüklü olduğunu nasıl kontrol edebilirim?
Kabuk betiğinde bu paketlerin kurulu olup olmadığını kontrol ediyorum, kurulmamışsa kurun. Yani, kabuk betiği ile: import nltk echo nltk.__version__ ancak importsatırda kabuk komut dosyasını durdurur linux terminalinde şu şekilde görmeye çalıştım: which nltk bu da kurulu olduğunu düşünmez. Bu paket kurulumunu kabuk komut dosyasında doğrulamanın başka bir yolu var mı, …

26
neredeyse tüm kitaplıkları kurarken pip sorunu
Neredeyse her şeyi kurmak için pip kullanmakta zorlanıyorum. Kodlamada yeniyim, bu yüzden belki de bunun yanlış yaptığım bir şey olduğunu düşündüm ve yapmam gereken şeylerin çoğunu elde etmek için easy_install'u seçtim, ki bu genellikle işe yaradı. Ancak, şimdi nltk kitaplığını indirmeye çalışıyorum ve hiçbiri işi tamamlamıyor. Girmeyi denedim sudo pip …
102 python  pip  nltk  easy-install 

17
Kaynak u'tokenizers / punkt / english.pickle 'bulunamadı
Kodum: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') Hata mesajı: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load opened_resource = _open(resource_url) File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open return find(path_, path + ['']).open() File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, …
100 python  unix  nltk 

6
Python: tf-idf-cosine: belge benzerliğini bulmak için
Bölüm 1 ve Bölüm 2'de bulunan bir öğreticiyi takip ediyordum . Maalesef yazarın, iki belge arasındaki mesafeyi gerçekten bulmak için kosinüs benzerliğini kullanmayı içeren son bölüm için zamanı yoktu. Stackoverflow'dan aşağıdaki link yardımıyla makaledeki örnekleri takip ettim , yukarıdaki linkte belirtilen kod dahil (sadece hayatı kolaylaştırmak için) from sklearn.feature_extraction.text import …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.