«unicode» etiketlenmiş sorular

Unicode, tüm yazı sistemlerini, teknik sembolleri ve noktalama işaretlerini içeren yazılı metin için gerekli tüm karakterleri desteklemek amacıyla metnin kodlanması, gösterilmesi ve işlenmesi için bir standarttır.

10
TypeError nasıl düzeltilir: Karma işleminden önce Unicode nesneleri kodlanmalıdır?
Bu hatayı aldım: Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(line) TypeError: Unicode-objects must be encoded before hashing Python 3.2.2 bu kodu yürütmeye çalıştığınızda : import hashlib, sys m = hashlib.md5() hash = "" hash_file = input("What is the file name in which the hash resides? …

6
Sözdizimi Hatası: İşlev '£' döndürdüğünde dosyada ASCII olmayan '\ xa3' karakteri
Diyelim ki bir fonksiyonum var: def NewFunction(): return '£' Önünde bir sayı işareti olan bazı şeyleri yazdırmak istiyorum ve bu programı çalıştırmaya çalıştığımda bir hata yazdırıyor, bu hata mesajı görüntülenir: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Birisi bana dönüş fonksiyonuma nasıl …

21
JSON'dan Unicode yerine dize nesneleri nasıl alınır?
ASCII kodlu metin dosyalarından JSON ayrıştırmak için Python 2 kullanıyorum . Bu dosyaları jsonveya ile yüklerken simplejson, tüm dize değerlerim dize nesneleri yerine Unicode nesnelerine dönüştürülür. Sorun, sadece dize nesneleri kabul bazı kütüphaneler ile veri kullanmak zorunda. Ben kütüphaneler değiştiremezsiniz ne de güncelleyin. Unicode olanlar yerine string nesneleri almak mümkün …


4
Geriye yazılan bu kod neden “Merhaba Dünya!”
İşte internette bulduğum bazı kodlar: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Bu kod ekrana yazdırılır Hello World!; burada çalıştığını görebilirsiniz . public static void mainYazılı olduğunu açıkça görebiliyorum , ama geriye doğru. Bu kod nasıl çalışır? Bu nasıl derleniyor? Düzenleme: IntellIJ bu kodu denedim ve iyi çalışıyor. Ancak, …

10
UnicodeDecodeError, geçersiz devam baytı
Aşağıdaki öğe neden başarısız oluyor? ve neden "latin-1" codec'i ile başarılı oluyor? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") sonuç: Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\Python27\lib\encodings\utf_8.py", …
257 python  unicode  decode 

7
ASCII olmayan karakterleri tek bir boşlukla değiştirme
ASCII olmayan (\ x00- \ x7F) karakterleri bir boşlukla değiştirmem gerekiyor. Bir şey eksik olmadıkça Python'da bunun kolay kolay olmadığına şaşırdım. Aşağıdaki işlev ASCII olmayan tüm karakterleri kaldırır: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) Ve bu ASCII olmayan karakterleri karakter kodu noktasındaki bayt miktarına göre boşluk …

13
Python: \ xa0 dizeden kaldırılsın mı?
Şu anda bir HTML dosyasını ayrıştırmak ve çağırmak için Güzel Çorba kullanıyorum get_text(), ancak boşlukları temsil eden \ xa0 Unicode bir sürü bırakılıyor gibi görünüyor. Hepsini Python 2.7'de kaldırmanın ve boşluklara dönüştürmenin etkili bir yolu var mı? Daha genel bir soru olurdu, Unicode biçimlendirmesini kaldırmak için bir yolu var mı? …
241 python  parsing  unicode 

12
Bir Unicode karakteri kaç bayt alır?
Kodlamalar konusunda biraz kafam karıştı. Bildiğim kadarıyla eski ASCII karakterleri karakter başına bir bayt aldı. Unicode karakteri kaç bayt gerektirir? Bir Unicode karakterinin herhangi bir dilden mümkün olan her karakteri içerebileceğini varsayıyorum - doğru muyum? Karakter başına kaç bayta ihtiyaç var? UTF-7, UTF-6, UTF-16 vb. Ne anlama geliyor? Unicode'un farklı …

5
Vim ile bir dosyanın kodlamasını nasıl değiştirebilirim?
Bir dosyanın satır sonlarını değiştirmek için vim kullanmaya alışkınım: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Bir dosyanın unicode kodlamasını değiştirmek için benzer bir işlem kullanılabilir mi? Aşağıdakileri deniyorum, ki bu …
235 vim  unicode 

8
Bir metin dosyasına Unicode metin mi yazıyorsunuz?
Verileri bir Google dokümanından alıyorum, işliyorum ve bir dosyaya yazıyorum (sonunda bir Wordpress sayfasına yapıştıracağım). Bazı ASCII olmayan sembolleri vardır. Bunları HTML kaynağında kullanılabilecek sembollere nasıl güvenli bir şekilde dönüştürebilirim? Şu anda, her şeyi bir Python dizesinde bir araya getirerek, Unicode'a dönüştürüyorum, sonra yapıyorum: import codecs f = codecs.open('out.txt', mode="w", …

5
C ++ 'da _tmain () ve main () arasındaki fark nedir?
C ++ uygulamamı aşağıdaki main () yöntemiyle çalıştırırsam her şey yolunda demektir: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout << i << …
224 c++  unicode  arguments 

18
Bash'de 4 basamaklı Unicode karakterini nasıl yankılanıyorsunuz?
Unicode kafatası ve kemiklerini kabuk istemime eklemek istiyorum (özellikle 'KAFATAS VE ÇAPRAZLAR' (U + 2620)), ama yankı tükürmek için sihirli büyüyü anlayamıyorum, ya da başka bir şey, 4 basamaklı Unicode karakter. İki basamaklı biri kolaydır. Örneğin, echo -e "\ x55",. Aşağıdaki cevaplara ek olarak, çıktının beklediğiniz gibi olması için terminalinizin …

11
JavaScript + Unicode normal ifadeleri
JavaScript'te Unicode kullanan normal ifadeleri nasıl kullanabilirim? Örneğin, \wHarfler veya İşaretler kategorisindeki (yalnızca ASCII olanlar için değil) herhangi bir kod noktasıyla eşleşebilecek benzer bir şey olmalı ve umarım noktalama vb. İçin [[P *]] gibi filtrelere sahip olmalıdır.

12
Markdown Sözdiziminde Dizin ve Dosya Yapısını Gösterme
Bazı Jekyll blog yazılarımda dizin ve dosya yapılarını tanımlamak istiyorum, Markdown böyle bir şey çıktı düzgün bir yol sağlar? Örneğin , Jekyll web sitesindeki bu bağlantıda dizin ve dosya yapısının sayfada çok düzgün bir şekilde çıktılandığını görebilirsiniz: . ├── _config.yml ├── _drafts │ ├── begin-with-the-crazy-ideas.textile │ └── on-simplicity-in-technology.markdown ├── _includes …
215 unicode  markdown  jekyll 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.