«tokenize» etiketlenmiş sorular

Simge oluşturma, bir dizeyi simge adı verilen ayrı öğelere bölme eylemidir.


16
Dize sınırlayıcı (C ++) kullanarak bir dizeyi C ++ içinde ayrıştırma (bölme)
Aşağıdaki kullanarak C ++ bir dize ayrıştırma: using namespace std; string parsed,input="text to be parsed"; stringstream input_stringstream(input); if (getline(input_stringstream,parsed,' ')) { // do some processing. } Tek bir karakter sınırlayıcı ile ayrıştırma iyidir. Ama ne bir dize sınırlayıcı olarak kullanmak istersem. Örnek: Bölmek istiyorum: scott>=tiger ile >=ayırıcı olarak ben Scott …
364 c++  parsing  split  token  tokenize 



10
Tarayıcı vs. StringTokenizer vs. String.Split
Ben sadece Java'nın Tarayıcı sınıfı hakkında öğrendim ve şimdi nasıl karşılaştırır / StringTokenizer ve String.Split ile rekabet merak ediyorum. StringTokenizer ve String.Split sadece Dizeleri üzerinde çalıştığını biliyorum, bu yüzden neden bir String için Tarayıcı kullanmak isteyeyim? Tarayıcı sadece ayırma için tek elden alışveriş mi olacak?

4
Bir “tokenizer”, “ayrıştırıcı” ve “lexers” ın ne olduğunu ve birbirleriyle nasıl ilişkili ve nasıl kullanıldıklarına dair net bir tanım mı arıyorsunuz?
Ben bir "tokenizer", "ayrıştırıcı" ve "lexer" ne olduğunu ve birbirleri ile nasıl açık bir tanımını arıyorum (örneğin, bir ayrıştırıcı bir tokenizer kullanır veya tam tersi)? Veri beyanı ve tanımları ayıklamak için c / h kaynak dosyaları üzerinden gidecek bir program oluşturmak gerekir. Örnekler arıyordum ve bazı bilgiler bulabilirim, ancak gramer …
151 parsing  lexer  tokenize 

5
Bir Python kodu satırı girintili iç içe geçme düzeyini bilebilir mi?
Böyle bir şeyden: print(get_indentation_level()) print(get_indentation_level()) print(get_indentation_level()) Böyle bir şey almak istiyorum: 1 2 3 Kod bu şekilde kendini okuyabilir mi? Tüm istediğim kodun daha iç içe bölümlerinden daha iç içe olması için çıktı. Bu, kodun okunmasını kolaylaştırdığı gibi, çıktıyı da okumayı kolaylaştırır. Tabii ki bunu manuel olarak uygulayabilirim, örneğin .format(), …


11
NLTK belirteç kullanarak noktalama işaretlerinden nasıl kurtulurum?
NLTK kullanmaya yeni başlıyorum ve metinden bir kelime listesini nasıl alacağımı tam olarak anlamıyorum. Kullanırsam nltk.word_tokenize(), bir kelime ve noktalama işareti listesi alırım. Bunun yerine sadece kelimelere ihtiyacım var. Noktalama işaretlerinden nasıl kurtulabilirim? Ayrıca word_tokenizebirden fazla cümlede çalışmaz: Son kelimeye noktalar eklenir.
125 python  nlp  tokenize  nltk 

13
Oracle'da dizeyi birden çok satıra bölme
Bunun PHP ve MYSQL ile bir dereceye kadar yanıtlandığını biliyorum, ancak birinin Oracle 10g (tercihen) ve 11g'de bir dizeyi (virgülle sınırlanmış) birden çok satıra bölmenin en basit yaklaşımını öğretip öğretemeyeceğini merak ediyordum. Tablo aşağıdaki gibidir: Name | Project | Error 108 test Err1, Err2, Err3 109 test2 Err1 Aşağıdakileri oluşturmak …
104 sql  string  oracle  plsql  tokenize 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.