Kaynak u'tokenizers / punkt / english.pickle 'bulunamadı

Question 1

Kodum:

import nltk.data
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')

Hata mesajı:

[ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py
Traceback (most recent call last):
File "mapper_local_v1.0.py", line 16, in <module>

    tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')

File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load

    opened_resource = _open(resource_url)

File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open

    return find(path_, path + ['']).open()

File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, in find

    raise LookupError(resource_not_found)

LookupError:

Resource u'tokenizers/punkt/english.pickle' not found.  Please
use the NLTK Downloader to obtain the resource:

    >>>nltk.download()

Searched in:
- '/home/ec2-user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''

Bu programı Unix makinesinde çalıştırmaya çalışıyorum:

Hata mesajına göre, unix makinemden python kabuğuna giriş yaptım ve aşağıdaki komutları kullandım:

import nltk
nltk.download()

ve sonra indirilebilir yükleyici ve liste seçeneklerini kullanarak mevcut tüm şeyleri indirdim ama sorun hala devam ediyor.

Çözümü internette bulmak için elimden geleni yaptım ama yukarıdaki adımlarımda bahsettiğimle aynı çözümü aldım.

Question 2

Alvas'ın cevabına eklemek için sadece punktkülliyatı indirebilirsiniz :

nltk.download('punkt')

İndirmek allbana aşırı geliyor. İstediğin bu değilse.

Question 3

Yalnızca punktmodeli indirmek istiyorsanız :

import nltk
nltk.download('punkt')

Hangi veriye / modele ihtiyacınız olduğundan emin değilseniz , NLTK'dan popüler veri kümelerini, modelleri ve etiketleyicileri yükleyebilirsiniz:

import nltk
nltk.download('popular')

Yukarıdaki komutla, veri setlerini indirmek için GUI kullanmaya gerek yoktur.

Question 4

Çözümü aldım:

import nltk
nltk.download()

NLTK Downloader başladığında

d) İndir l) Liste u) Güncelle c) Yapılandır h) Yardım q) Çık

İndirici> d

Hangi paket indirilsin (l = liste; x = iptal)? Tanımlayıcı> punkt

Question 5

Kabuktan şunları çalıştırabilirsiniz:

sudo python -m nltk.downloader punkt

Popüler NLTK corpora / modellerini kurmak istiyorsanız:

sudo python -m nltk.downloader popular

Tüm NLTK corpora / modellerini kurmak istiyorsanız :

sudo python -m nltk.downloader all

İndirdiğiniz kaynakları listelemek için:

python -c 'import os; import nltk; print os.listdir(nltk.data.find("corpora"))'
python -c 'import os; import nltk; print os.listdir(nltk.data.find("tokenizers"))'

Question 6

import nltk
nltk.download('punkt')

Python istemini açın ve yukarıdaki ifadeleri çalıştırın.

Sent_tokenize fonksiyonu örneğini kullanır PunktSentenceTokenizer gelen nltk.tokenize.punkt modülü. Bu örnek zaten eğitilmiş ve birçok Avrupa dili için iyi çalışıyor. Böylece bir cümlenin sonunu ve yeni bir cümlenin başlangıcını hangi noktalama işaretlerinin ve karakterlerin işaretlediğini bilir.

Question 7

Geçenlerde bana da aynı şey oldu, sadece "punkt" paketini indirmen gerekiyor ve çalışmalı.

"Mevcut tüm şeyleri indirdikten" sonra "list" (l) 'i çalıştırdığınızda, her şey aşağıdaki satır gibi işaretlenir mi ?:

[*] punkt............... Punkt Tokenizer Models

Bu çizgiyi yıldızla birlikte görürseniz, bu ona sahip olduğunuz anlamına gelir ve nltk onu yükleyebilir.

Question 8

Yazarak python konsoluna gidin

$ python

terminalinizde. Ardından, ilgili paketleri kurmak için python kabuğunuza aşağıdaki 2 komutu yazın:

>> nltk.download ('punkt') >> nltk.download ('averaged_perceptron_tagger')

Bu benim için sorunu çözdü.

Question 9

Bu kod satırını ekledikten sonra sorun çözülecektir:

nltk.download('punkt')

Question 10

Aşağıdakileri içe aktarmama rağmen bir hata alıyordum,

import nltk
nltk.download()

ancak google colab için bu sorunumu çözdü.

   !python3 -c "import nltk; nltk.download('all')"

Question 11

Sorunum nltk.download('all')kök kullanıcı olarak aramamdı, ancak sonunda nltk'yi kullanan işlem, içeriğin indirildiği / root / nltk_data'ya erişimi olmayan başka bir kullanıcıydı.

Bu yüzden, indirme konumundan NLTK'nin onu bulmaya çalıştığı yollardan birine her şeyi yinelemeli olarak kopyaladım:

cp -R /root/nltk_data/ /home/ubuntu/nltk_data

Question 12

Basit nltk.download () bu sorunu çözmeyecektir. Aşağıdakileri denedim ve benim için çalıştı:

nltk klasöründe bir tokenizers klasörü oluşturun ve punkt klasörünüzü tokenizers klasörüne kopyalayın.

Bu çalışacak.! klasör yapısının resimde gösterildiği gibi olması gerekir

Question 13

Aşağıdaki kodu yürütün:
```
import nltk
nltk.download()
```
Bundan sonra, NLTK indiricisi çıkacaktır.
Tüm paketler'i seçin.
Punkt'ı indirin.

Question 14

Klasörlerinizi yeniden düzenlemeniz gerekiyor tokenizersKlasörünüzü klasöre taşıyın nltk_data. Eğer varsa, bu işe yaramazsa nltk_dataiçeren klasörü corporaiçeren klasör tokenizersklasör

Question 15

Benim için yukarıdakilerin hiçbiri işe yaramadı, bu yüzden tüm dosyaları el ile http://www.nltk.org/nltk_data/ web sitesinden indirdim ve ayrıca onları "nltk_data" içindeki bir "belirteçler" dosyasına elle koydum. " Klasör. Güzel bir çözüm değil ama yine de bir çözüm.

Question 16

Ben de aynı sorunla karşılaştım. Her şeyi indirdikten sonra, hala 'punkt' hatası vardı. Windows makinemde C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers konumunda paket aradım ve orada bulunan 'punkt.zip'i görebiliyorum. Bir şekilde zip dosyasının C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers \ punk'a çıkartılmadığını fark ettim. Zipi çıkardıktan sonra müzik gibi çalıştı.

Question 17

Sadece JupyterNotebook kullandığınızdan emin olun ve bir not defterinde aşağıdakileri yapın:

import nltk

nltk.download()

Sonra bir açılır pencere görünecektir ( https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml bilgilerini gösteren ) Bundan sonra her şeyi indirmelisiniz.

Ardından kodunuzu yeniden çalıştırın.

Question 18

Benim için "nltk:" kullanılarak çözüldü

http://www.nltk.org/howto/data.html

Nltk.data.load ile english.pickle yüklenemedi

sent_tokenizer=nltk.data.load('nltk:tokenizers/punkt/english.pickle')