«unicode» etiketlenmiş sorular

Unicode, tüm yazı sistemlerini, teknik sembolleri ve noktalama işaretlerini içeren yazılı metin için gerekli tüm karakterleri desteklemek amacıyla metnin kodlanması, gösterilmesi ve işlenmesi için bir standarttır.

12
Sembolleri, Vurgu Harflerini İngilizce Alfabeye Dönüştürme
Sorun şu ki, bildiğiniz gibi , Unicode grafiğinde binlerce karakter var ve tüm benzer karakterleri İngilizce alfabesindeki harflere dönüştürmek istiyorum. Örneğin, işte birkaç dönüşüm: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... ve A / a harfinin 20'den fazla versiyonu olduğunu gördüm. ve onları nasıl sınıflandıracağımı bilmiyorum. …

7
Normalleştirilmiş UTF-8 nedir?
Yoğun bakım projesi (aynı zamanda artık bir olan PHP kütüphanesi ) ararken daha kolay değerleri karşılaştırmak için yapmak yardım normalleştirmek UTF-8 dizeleri için gerekli sınıfları içerir. Ancak bunun uygulamalar için ne anlama geldiğini anlamaya çalışıyorum . Örneğin, hangi durumlarda "Uyumluluk eşdeğeri" yerine "Kanonik Eşdeğer" veya tam tersi olmasını isterim?

8
HTML karakter kodu 8203 nedir?
Karakter kodu (HTML) ​nedir? Bunu jQuery betiklerimden birinde buldum ve ne olduğunu merak ettim .. Teşekkürler. Düzenle: İşte içinde bulunduğu betik (sonuna eklendi, Firebug'da bulundu) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); }, function() { if(!$jnyh(this).data('pinned')) $jnyh(".show-hide-nyh").slideUp("slow"); }); $jnyh("#title-nyh").click(function() { $jnyh(this).parent().toggleClass("title-btm-brdr"); $jnyh(this).toggleClass("chev-up-result"); var …


3
Java normal ifadelerinde \ w ve \ b için Unicode eşdeğerleri?
Birçok modern normal ifade uygulaması, \wkarakter sınıfının kısaltmasını "herhangi bir harf, rakam veya bağlantı noktalama" (genellikle: alt çizgi) olarak yorumlar. Bu şekilde, böyle bir düzenli ifade \w+maçları kelime gibi hello, élève, GOÄ_432veya gefräßig. Ne yazık ki Java yok. Java'da, \wile sınırlıdır [A-Za-z0-9_]. Bu, diğer sorunların yanı sıra yukarıda bahsedilenler gibi …

7
Python - 'ascii' codec bileşeni bayt kodunu çözemez
Gerçekten kafam karıştı. Kodlamayı denedim ama hata dedi can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Dizede "u" ön eki olan hatayı nasıl önleyeceğimi biliyorum. Kodlama çağrıldığında hatanın neden …

10
Unicode karakterlerinin JavaScript'ten HTML'de emoji olarak işlenmesi nasıl engellenir?
FileFormat.Info'nun aramasından özel karakterler için Unicode buluyorum . ⚠ (uyarı işareti \u26A0veya ⚠) gibi bazı karakterler klasik siyah beyaz glifler olarak görüntüleniyor . CSS stilleri (renk gibi) uygulayabildiğim için bunlar tercih edilir. Diğerleri, ⌛ (kum saati \u231Bveya ⌛) gibi daha yeni çizgi film benzeri emoji olarak işliyor . Tam olarak …
119 javascript  html  css  unicode  emoji 


13
Numarasından Unicode karakteri oluşturma
Java'da bir Unicode karakteri görüntülemek istiyorum. Bunu yaparsam gayet iyi çalışıyor: String symbol = "\u2202"; sembolü "∂" ye eşittir. İstediğim şey bu. Sorun şu ki, Unicode numarasını bilmem ve bundan Unicode sembolünü yaratmam gerekiyor. (Bana) apaçık olan şeyi denedim: int c = 2202; String symbol = "\\u" + c; Ancak …

6
UTF-8'i Perl'den nasıl çıkarabilirim?
"Utf8" pragmasını kullanarak bir Perl betiği yazmaya çalışıyorum ve beklenmedik sonuçlar alıyorum. Mac OS X 10.5 (Leopard) kullanıyorum ve TextMate ile düzenleme yapıyorum. Hem editörüm hem de işletim sistemim için tüm ayarlarım varsayılan olarak dosyaları utf-8 biçiminde yazacak şekilde ayarlandı. Ancak, aşağıdakini bir metin dosyasına girip, onu bir ".pl" olarak …
110 perl  unicode  utf-8 

3
UTF-8 "değişken genişlikli kodlama" nasıl çalışır?
Unicode standardı, hepsini depolamak için 4 bayta ihtiyacınız olacak kadar yeterli kod noktasına sahiptir. UTF-32 kodlamasının yaptığı budur. Yine de UTF-8 kodlaması, "değişken genişlikli kodlama" adı verilen bir şey kullanarak bunları bir şekilde çok daha küçük alanlara sıkıştırır. Aslında, US-ASCII'nin ilk 127 karakterini tam olarak gerçek ASCII'ye benzeyen tek bir …

3
Gerçek kullanımda en yaygın BMP Unicode olmayan karakterler nelerdir? [kapalı]
Kapalı . Bu soruya daha çok odaklanılması gerekiyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek mi istiyorsunuz? Soruyu yalnızca bu gönderiyi düzenleyerek tek bir soruna odaklanacak şekilde güncelleyin . 6 yıl önce kapalı . Bu soruyu geliştirin Deneyimlerinize göre, şu ana kadar BMP (Temel Çok Dilli Düzlem) dışındaki …

5
Unicode karakterlerini URL kodlamanın doğru yolu nedir?
Standart olmayan% uxxxx şemasını biliyorum, ancak bu plan W3C tarafından reddedildiği için akıllıca bir seçim gibi görünmüyor. Bazı ilginç örnekler: Kalp karakteri. Bunu tarayıcıma yazarsam: http://www.google.com/search?q=♥ Sonra kopyalayıp yapıştırın, bu URL'yi görüyorum http://www.google.com/search?q=%E2%99%A5 Firefox (veya Safari) bunu yapıyor gibi görünmesini sağlar. urllib.quote_plus(x.encode("latin-1")) '%E2%99%A5' Bu, üçlü nokta karakteri gibi Latin-1'de kodlanamayan …


16
UnicodeDecodeError: 'ascii' codec bileşeni, konum 1'deki bayt 0xef kodunu çözemiyor
Bir dizeyi UTF-8 olarak kodlamaya çalışırken birkaç sorun yaşıyorum. Kullandığım dahil çok sayıda şeyleri, denedim string.encode('utf-8')ve unicode(string)ama hata alıyorum: UnicodeDecodeError: 'ascii' codec bileşeni, 1 konumundaki bayt 0xef kodunu çözemiyor: ordinal aralıkta değil (128) Bu benim dizim: (。・ω・。)ノ Neyin yanlış gittiğini anlamıyorum, herhangi bir fikriniz var mı? Düzenleme: Sorun, dizeyi olduğu …
106 python  unicode  utf-8 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.