«unicode» etiketlenmiş sorular

Unicode, tüm yazı sistemlerini, teknik sembolleri ve noktalama işaretlerini içeren yazılı metin için gerekli tüm karakterleri desteklemek amacıyla metnin kodlanması, gösterilmesi ve işlenmesi için bir standarttır.


7
Java kodunun neden bazı Unicode karakterlerle yorumlarda yürütülmesine izin veriliyor?
Aşağıdaki kod "Merhaba Dünya!" (hayır, gerçekten deneyin). public static void main(String... args) { // The comment below is not a typo. // \u000d System.out.println("Hello World!"); } Bunun nedeni, Java derleyicisinin Unicode karakterini \u000dyeni bir satır olarak ayrıştırması ve dönüştürülmesi: public static void main(String... args) { // The comment below is …
1356 java  unicode  comments 

28
UnicodeEncodeError: 'ascii' codec bileşeni 20 konumunda u '\ xa0' karakterini kodlayamıyor: sıra değeri aralıkta değil (128)
Farklı web sayfalarından (farklı sitelerde) getirilen metinden unicode karakterlerle ilgili sorunlar yaşıyorum. BeautifulSoup kullanıyorum. Sorun, hatanın her zaman yeniden üretilememesidir; bazen bazı sayfalarla çalışır ve bazen a UnicodeEncodeError. Aklıma gelen her şeyi denedim ve yine de Unicode ile ilgili bir tür hata atmadan sürekli çalışan bir şey bulamadım. Kodun sorunlara …



8
'B' karakteri bir dizgi değişmezinin önünde ne yapar?
Görünüşe göre, aşağıdaki sözdizimi şöyledir: my_string = b'The string' Bilmek isterim: bDizenin önündeki bu karakter ne anlama geliyor? Kullanmanın etkileri nelerdir? Kullanmak için uygun durumlar nelerdir? Burada SO ile ilgili bir soru buldum , ancak bu soru PHP ile ilgili olsa da ve bkodun PHP <6 sürümünden uyumlu olması için …
831 python  string  unicode  binary 


12
std :: wstring VS std :: dize
Ben arasındaki farkı anlamak mümkün değilim std::stringve std::wstring. wstringUnicode karakterler gibi geniş karakterleri desteklediğini biliyorum . Aşağıdaki sorularım var: Ne zaman kullanmalıyım std::wstringüzerinde std::string? Yapabilmek std::string özel karakterler dahil tüm ASCII karakter kümesi, tutun? Dır-dir std::wstring tüm popüler C ++ derleyici tarafından desteklenen? Tam olarak " geniş karakter " nedir?
741 c++  string  unicode  c++-faq  wstring 



15
Twitter resim kodlama zorluğu [kapalı]
Şu anda olduğu gibi, bu soru Soru-Cevap formatımıza uygun değil. Yanıtların gerçekler, referanslar veya uzmanlık tarafından desteklenmesini bekliyoruz, ancak bu soru muhtemelen tartışma, tartışma, oylama veya genişletilmiş tartışma talep edecektir. Bu sorunun çözülebileceğini ve muhtemelen yeniden açılabileceğini düşünüyorsanız, yardım için yardım merkezini ziyaret edin . 8 yıl önce kapalı . …

7
Modern Perl neden varsayılan olarak UTF-8'den kaçınır?
Perl kullanılarak oluşturulan modern çözümlerin çoğunun neden varsayılan olarak UTF-8'i etkinleştirmediğini merak ediyorum . Temel Perl betikleri için bazı şeyleri kırabileceği birçok eski sorun olduğunu anlıyorum. Ama, benim bakış itibaren, 21 st yüzyılda, yeni büyük projeler (ya da büyük bir bakış açısı ile projeler) sıfırdan kendi yazılım UTF-8 kanıt yapmalıdır. …
557 perl  unicode  utf-8 

8
UnicodeDecodeError: 'charmap' kodek Y konumunda X baytının kodunu çözemiyor: karakter <defined> ile eşleşiyor
Bilgi dolu bir metin dosyası ile bazı manipülasyonlar yapmak için bir Python 3 programı almaya çalışıyorum. Ancak, dosyayı okumaya çalışırken aşağıdaki hatayı alıyorum: Traceback (most recent call last): File "SCRIPT LOCATION", line NUMBER, in &lt;module&gt; `text = file.read()` File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode `return codecs.charmap_decode(input,self.errors,decoding_table)[0]` UnicodeDecodeError: 'charmap' codec can't …

6
Swift dizelerinde neden o‍👩‍👧‍👦 gibi emoji karakterlerine bu kadar garip davranılıyor?
👩‍👩‍👧‍👦 karakteri (iki kadın, bir kız ve bir erkek olan aile) şöyle kodlanır: U+1F469 WOMAN, ‍U+200D ZWJ, U+1F469 WOMAN, U+200D ZWJ, U+1F467 GIRL, U+200D ZWJ, U+1F466 BOY Yani çok ilginç bir şekilde kodlanmış; birim test için mükemmel hedef. Ancak Swift, nasıl tedavi edileceğini bilmiyor gibi görünüyor. Demek istediğim şu: "👩‍👩‍👧‍👦".contains("👩‍👩‍👧‍👦") …
540 swift  string  unicode  emoji 

17
Metin dosyalarını karakter kümeleri arasında dönüştürmenin en iyi yolu?
Metin dosyalarını karakter setleri arasında dönüştürmek için en hızlı, en kolay araç veya yöntem nedir? Özellikle, UTF-8'den ISO-8859-15'e ve tam tersine dönüştürmem gerekiyor. Her şey geçerli: en sevdiğiniz kodlama dilinde bir satır, komut satırı araçları veya işletim sistemi, web siteleri vb. İçin diğer yardımcı programlar. Şimdiye kadarki en iyi çözümler: …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.