Programlama character-encoding

17

Birçoğu hiç sıralama yeteneği ile tablo verileri olan çok sayıda klasik ASP sayfası korumak zorunda. Veritabanı sorgusunda kullanılan orijinal geliştiricinin siparişi ne olursa olsun, takıldığınız şeydir. Bu sayfaların bir demet bazı temel sıralama tack istiyorum ve ben tüm istemci tarafı javascript ile yapıyorum. Zaten belirli bir yönde belirli bir sütunda …

265 html sorting user-interface character-encoding character

13

Java'da Dizeleri UTF8 bayt dizilerine dönüştürme

Java, ben bir String var ve bir bayt dizisi (UTF8 veya başka bir kodlama) olarak kodlamak istiyorum. Alternatif olarak, bir bayt dizisi (bazı bilinen kodlamada) var ve bir Java String dönüştürmek istiyorum. Bu dönüşümleri nasıl yaparım?

239 java string encoding character-encoding

8

Bir metin dosyasına Unicode metin mi yazıyorsunuz?

Verileri bir Google dokümanından alıyorum, işliyorum ve bir dosyaya yazıyorum (sonunda bir Wordpress sayfasına yapıştıracağım). Bazı ASCII olmayan sembolleri vardır. Bunları HTML kaynağında kullanılabilecek sembollere nasıl güvenli bir şekilde dönüştürebilirim? Şu anda, her şeyi bir Python dizesinde bir araya getirerek, Unicode'a dönüştürüyorum, sonra yapıyorum: import codecs f = codecs.open('out.txt', mode="w", …

225 python unicode character-encoding python-2.x

18

Bash'de 4 basamaklı Unicode karakterini nasıl yankılanıyorsunuz?

Unicode kafatası ve kemiklerini kabuk istemime eklemek istiyorum (özellikle 'KAFATAS VE ÇAPRAZLAR' (U + 2620)), ama yankı tükürmek için sihirli büyüyü anlayamıyorum, ya da başka bir şey, 4 basamaklı Unicode karakter. İki basamaklı biri kolaydır. Örneğin, echo -e "\ x55",. Aşağıdaki cevaplara ek olarak, çıktının beklediğiniz gibi olması için terminalinizin …

224 bash shell unicode character-encoding

10

ANSI formatı nedir?

ANSI kodlama formatı nedir? Bir sistem varsayılan biçimi mi? ASCII'den ne şekilde farklıdır?

217 character-encoding ascii ansi codepages

10

Dikey sekme nedir?

Dikey sekme karakterinin orijinal tarihi kullanımı neydi ( \vC dilinde, ASCII 11)? Klavyede hiç anahtarı var mıydı? Birisi nasıl üretti? Dikey sekme karakterinin ilginç ve faydalı bir şey yaptığı günümüzde hala kullanılmakta olan herhangi bir dil veya sistem var mı?

216 character-encoding ascii special-characters character

10

“For line in…”, UnicodeDecodeError ile sonuçlanır: 'utf-8' codec bileşeni bayt kodunu çözemez

İşte kodum, for line in open('u.item'): #read each line ne zaman bu kodu çalıştırmak aşağıdaki hatayı verir: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Bunu çözmek ve open () ekstra bir parametre eklemek için çalıştı, kod gibi görünüyor; for line in open('u.item', encoding='utf-8'): #read …

215 python python-3.x character-encoding

6

Karakter seti adları neden sabit değildir?

Karakter kümesi sorunları kafa karıştırıcı ve karmaşıktır, ancak bunun üzerine karakter kümelerinizin tam adlarını hatırlamanız gerekir. Öyle mi "utf8"? Yoksa "utf-8"? Ya da belki "UTF-8"? İnternette kod örnekleri ararken, yukarıdakilerin tümünü göreceksiniz. Neden onları sadece sabit olarak adlandırmıyorsunuz Charset.UTF8?

211 java character-encoding

16

'&' Kelimesini '& amp;' olarak kodlamam gerekiyor mu?

&Sitemin HTML5 ve UTF-8 ile bir ' ' sembolü kullanıyorum <title>. Google, başlıklarındaki tüm tarayıcılarda olduğu gibi, SERP'lerde ve işareti iyi gösteriyor. http://validator.w3.org bana bunu veriyor: & karakter başvurusu başlatmadı. (& muhtemelen kaçmış olmalıydı &amp;.) Gerçekten yapmam gerekiyor &amp;mu? Sayfalarımın doğrulanması amacıyla doğrulanmasından endişe etmiyorum, ancak insanların bu konudaki fikirlerini …

207 validation html utf-8 character-encoding

12

PHP DOMDocument loadHTML, UTF-8'i doğru kodlamıyor

Ben DOMDocument kullanarak bazı HTML ayrıştırmak için çalışıyorum, ama bunu yaptığımda aniden kodumu (en azından bana böyle görünüyor) kaybederim. $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Bu kod sonucu Japonca olmayan bir sürü karakter elde olmasıdır. …

195 php utf-8 character-encoding

6

Encode / decode arasındaki fark nedir?

Asla str / unicode decode ve encode arasındaki farkı anladığımdan emin olamadım. Bunu biliyorum str().decode()adını kodlayan bir unicode dize döneceğini verilen belli bir karakter kodlaması vardır biliyorum sen bayt bir dize olduğunda içindir. unicode().encode()Unicode karakterleri verilen bir kodlama adına göre bayt dizesine dönüştürür biliyorum . Ama ne için olduğunu str().encode()ve …

180 python string unicode character-encoding python-2.x

11

Unicode'u Python'da hata olmadan ASCII'ye dönüştürme

Kodum sadece bir web sayfasını kazıyarak daha sonra Unicode'a dönüştürür. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Ama şunu elde ederim UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal …

178 python unicode utf-8 character-encoding ascii

4

@Charset “UTF-8” neden belirtilmelidir; dosyasında?

Bu talimatı bana çevrilmiş çok sayıda CSS dosyasının ilk satırı olarak görüyorum: @charset "UTF-8"; Ne işe yarıyor ve bu kural gereği gerekli mi? Ayrıca, bu meta etiketi "head" öğeme dahil edersem, bu da CSS dosyalarımda bulunma ihtiyacını ortadan kaldırır mı? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

173 css character-encoding

7

C # dilinde dizeyi UTF-8'e nasıl dönüştürebilirim?

Üçüncü taraf bir uygulamadan aldığım bir dizem var ve Windows Yüzeyimde C # kullanarak herhangi bir dilde doğru şekilde görüntülemek istiyorum. Hatalı kodlama nedeniyle dizemin bir parçası İspanyolcada şöyle görünüyor: AcciÃ³n oysa şöyle görünmelidir: Acción Bu sorunun cevabına göre: C # 'da string kodlaması nasıl anlaşılır, aldığım kodlama UTF-8 üzerinde …

154 c# string encoding utf-8 character-encoding

11

Kodlama ve karakter kümesi arasındaki fark nedir?

Metin kodlama ve karakter kümesi hakkında kafam karıştı. Birçok nedenden dolayı, yaklaşan çalışmamda Unicode olmayan, UTF8 olmayan şeyler öğrenmem gerekiyor. E-posta başlıklarında "charset" kelimesini "ISO-2022-JP" gibi buluyorum, ancak metin editörlerinde böyle bir kodlama yok. (Farklı metin editörlerine baktım.) Metin kodlaması ile karakter kümesi arasındaki fark nedir? Bana bazı kullanım örneği …

151 encoding character-encoding

«character-encoding» etiketlenmiş sorular