«character-encoding» etiketlenmiş sorular

Karakter kodlaması, karakterlerin bir bayt dizisi olarak temsil edilme biçimini ifade eder. Web için karakter kodlaması Kodlama Standardında tanımlanmıştır.

17
Baş aşağı caret karakteri var mı?
Birçoğu hiç sıralama yeteneği ile tablo verileri olan çok sayıda klasik ASP sayfası korumak zorunda. Veritabanı sorgusunda kullanılan orijinal geliştiricinin siparişi ne olursa olsun, takıldığınız şeydir. Bu sayfaların bir demet bazı temel sıralama tack istiyorum ve ben tüm istemci tarafı javascript ile yapıyorum. Zaten belirli bir yönde belirli bir sütunda …


8
Bir metin dosyasına Unicode metin mi yazıyorsunuz?
Verileri bir Google dokümanından alıyorum, işliyorum ve bir dosyaya yazıyorum (sonunda bir Wordpress sayfasına yapıştıracağım). Bazı ASCII olmayan sembolleri vardır. Bunları HTML kaynağında kullanılabilecek sembollere nasıl güvenli bir şekilde dönüştürebilirim? Şu anda, her şeyi bir Python dizesinde bir araya getirerek, Unicode'a dönüştürüyorum, sonra yapıyorum: import codecs f = codecs.open('out.txt', mode="w", …

18
Bash'de 4 basamaklı Unicode karakterini nasıl yankılanıyorsunuz?
Unicode kafatası ve kemiklerini kabuk istemime eklemek istiyorum (özellikle 'KAFATAS VE ÇAPRAZLAR' (U + 2620)), ama yankı tükürmek için sihirli büyüyü anlayamıyorum, ya da başka bir şey, 4 basamaklı Unicode karakter. İki basamaklı biri kolaydır. Örneğin, echo -e "\ x55",. Aşağıdaki cevaplara ek olarak, çıktının beklediğiniz gibi olması için terminalinizin …


10
Dikey sekme nedir?
Dikey sekme karakterinin orijinal tarihi kullanımı neydi ( \vC dilinde, ASCII 11)? Klavyede hiç anahtarı var mıydı? Birisi nasıl üretti? Dikey sekme karakterinin ilginç ve faydalı bir şey yaptığı günümüzde hala kullanılmakta olan herhangi bir dil veya sistem var mı?

10
“For line in…”, UnicodeDecodeError ile sonuçlanır: 'utf-8' codec bileşeni bayt kodunu çözemez
İşte kodum, for line in open('u.item'): #read each line ne zaman bu kodu çalıştırmak aşağıdaki hatayı verir: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Bunu çözmek ve open () ekstra bir parametre eklemek için çalıştı, kod gibi görünüyor; for line in open('u.item', encoding='utf-8'): #read …

6
Karakter seti adları neden sabit değildir?
Karakter kümesi sorunları kafa karıştırıcı ve karmaşıktır, ancak bunun üzerine karakter kümelerinizin tam adlarını hatırlamanız gerekir. Öyle mi "utf8"? Yoksa "utf-8"? Ya da belki "UTF-8"? İnternette kod örnekleri ararken, yukarıdakilerin tümünü göreceksiniz. Neden onları sadece sabit olarak adlandırmıyorsunuz Charset.UTF8?

16
'&' Kelimesini '& amp;' olarak kodlamam gerekiyor mu?
&Sitemin HTML5 ve UTF-8 ile bir ' ' sembolü kullanıyorum <title>. Google, başlıklarındaki tüm tarayıcılarda olduğu gibi, SERP'lerde ve işareti iyi gösteriyor. http://validator.w3.org bana bunu veriyor: & karakter başvurusu başlatmadı. (& muhtemelen kaçmış olmalıydı &.) Gerçekten yapmam gerekiyor &mu? Sayfalarımın doğrulanması amacıyla doğrulanmasından endişe etmiyorum, ancak insanların bu konudaki fikirlerini …

12
PHP DOMDocument loadHTML, UTF-8'i doğru kodlamıyor
Ben DOMDocument kullanarak bazı HTML ayrıştırmak için çalışıyorum, ama bunu yaptığımda aniden kodumu (en azından bana böyle görünüyor) kaybederim. $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Bu kod sonucu Japonca olmayan bir sürü karakter elde olmasıdır. …

6
Encode / decode arasındaki fark nedir?
Asla str / unicode decode ve encode arasındaki farkı anladığımdan emin olamadım. Bunu biliyorum str().decode()adını kodlayan bir unicode dize döneceğini verilen belli bir karakter kodlaması vardır biliyorum sen bayt bir dize olduğunda içindir. unicode().encode()Unicode karakterleri verilen bir kodlama adına göre bayt dizesine dönüştürür biliyorum . Ama ne için olduğunu str().encode()ve …

11
Unicode'u Python'da hata olmadan ASCII'ye dönüştürme
Kodum sadece bir web sayfasını kazıyarak daha sonra Unicode'a dönüştürür. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Ama şunu elde ederim UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal …

4
@Charset “UTF-8” neden belirtilmelidir; dosyasında?
Bu talimatı bana çevrilmiş çok sayıda CSS dosyasının ilk satırı olarak görüyorum: @charset "UTF-8"; Ne işe yarıyor ve bu kural gereği gerekli mi? Ayrıca, bu meta etiketi "head" öğeme dahil edersem, bu da CSS dosyalarımda bulunma ihtiyacını ortadan kaldırır mı? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

7
C # dilinde dizeyi UTF-8'e nasıl dönüştürebilirim?
Üçüncü taraf bir uygulamadan aldığım bir dizem var ve Windows Yüzeyimde C # kullanarak herhangi bir dilde doğru şekilde görüntülemek istiyorum. Hatalı kodlama nedeniyle dizemin bir parçası İspanyolcada şöyle görünüyor: Acción oysa şöyle görünmelidir: Acción Bu sorunun cevabına göre: C # 'da string kodlaması nasıl anlaşılır, aldığım kodlama UTF-8 üzerinde …

11
Kodlama ve karakter kümesi arasındaki fark nedir?
Metin kodlama ve karakter kümesi hakkında kafam karıştı. Birçok nedenden dolayı, yaklaşan çalışmamda Unicode olmayan, UTF8 olmayan şeyler öğrenmem gerekiyor. E-posta başlıklarında "charset" kelimesini "ISO-2022-JP" gibi buluyorum, ancak metin editörlerinde böyle bir kodlama yok. (Farklı metin editörlerine baktım.) Metin kodlaması ile karakter kümesi arasındaki fark nedir? Bana bazı kullanım örneği …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.