«unicode» etiketlenmiş sorular

Unicode, tüm yazı sistemlerini, teknik sembolleri ve noktalama işaretlerini içeren yazılı metin için gerekli tüm karakterleri desteklemek amacıyla metnin kodlanması, gösterilmesi ve işlenmesi için bir standarttır.


11
Python'da unicode dizelerini alfabetik olarak nasıl sıralayabilirim?
Python varsayılan olarak bayt değerine göre sıralar, yani é, z ve diğer eşit derecede komik şeylerden sonra gelir. Python'da alfabetik olarak sıralamanın en iyi yolu nedir? Bunun için bir kütüphane var mı? Hiçbir şey bulamadım. Tercihen sıralama dil desteğine sahip olmalıdır, böylece åäö'nun İsveççe'de z'den sonra sıralanması gerektiğini, ancak ü'nin …





10
"Birbirine benzeyen" Unicode karakterleri nasıl karşılaştırılır?
Şaşırtıcı bir konuya düşüyorum. Uygulamama bir metin dosyası yükledim ve µ değerine sahip olan değeri karşılaştıran bazı mantığım var. Metinler aynı olsa bile karşılaştırma değerinin yanlış olduğunu fark ettim. Console.WriteLine("μ".Equals("µ")); // returns false Console.WriteLine("µ".Equals("µ")); // return true Daha sonraki satırda µ karakteri kopyalanarak yapıştırılır. Ancak, bunun gibi olan tek karakterler …

3
Bir metin görünümünde unicode ile emoji nasıl ayarlanır?
Merhaba aşağıdakileri yapmak istiyorum: ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); bunu metin görünümümde almak için: Çok mutluyum 😊 Nasıl uygulayabilirim getEmojiByUnicode(unicode)? unicodeDeğişken ne tür olmalıdır ? (String, char, int?) Lütfen Drawables'ı kullanmak İSTEMİYORUM!

13
Aynı çıktı üreten JavaScript'in encodeURIC bileşenine eşdeğer Java mı?
Tırnak işaretlerini, boşlukları ve "egzotik" Unicode karakterlerini içeren bir dizeyi kodlayacak ve JavaScript'in encodeURIComponent işleviyle aynı çıktıyı üretecek bir şey bulmaya çalışan çeşitli Java kod parçalarını deniyorum . İşkence test dizim: "A" B ± " Firebug'a aşağıdaki JavaScript ifadesini girersem: encodeURIComponent('"A" B ± "'); -Sonra şunu alırım: "%22A%22%20B%20%C2%B1%20%22" İşte küçük …

4
Bu Unicode karakterleri birleştirmede ne var ve onları nasıl filtreleyebiliriz?
กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ Bunlar son zamanlarda facebook yorum bölümlerinde göründü. Bunu nasıl sterilize edebiliriz?


6
JSON karakter kodlaması - UTF-8 tarayıcılar tarafından iyi destekleniyor mu yoksa sayısal kaçış dizileri mi kullanmalıyım?
Kaynaklarını temsil etmek için json kullanan bir web hizmeti yazıyorum ve json'u kodlamanın en iyi yolunu düşünürken biraz takılı kaldım. Json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) okunduğunda, tercih edilen kodlamanın utf-8 olduğu açıktır. Ancak rfc ayrıca karakterleri belirlemek için bir dizge kaçış mekanizmasını tanımlar. Bunun genellikle ascii olmayan karakterlerden kaçmak için …

5
sqlite3.ProgrammingError: 8 bitlik bytestrings'i yorumlayabilen bir text_factory kullanmadığınız sürece 8 bitlik bytestrings kullanmamalısınız.
Python'da SQLite3 kullanarak, UTF-8 HTML kod parçacığının sıkıştırılmış bir sürümünü saklamaya çalışıyorum. Kod şuna benzer: ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid, zlib.compress(html))) Hangi noktada hatayı alırsınız: sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you …
90 python  unicode  sqlite  zlib 

5
Gerçekten İyi, Kötü UTF-8 örnek test verileri [kapalı]
Kapalı. Bu soru Yığın Taşması yönergelerini karşılamıyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek mi istiyorsunuz? Yığın Taşması için konuya uygun olması için soruyu güncelleyin . 3 yıl önce kapalı . Bu soruyu geliştirin Bu yüzden, XSS filtrelememizi test etmek için XSS hile kağıdına sahibiz - ancak örnek …
89 unicode  utf-8 

8
Java'da yazdırılamayan Unicode karakterlerini nasıl değiştirebilirim?
Aşağıdakiler ASCII kontrol karakterlerinin yerini alacaktır (kısaltması [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); Aşağıdakiler, [\p{Graph}\x20]aksanlı karakterler dahil olmak üzere tüm ASCII yazdırılamayan karakterlerin (kısaltması ) yerini alacaktır : my_string.replaceAll("[^\\p{Print}]", "?"); Ancak, Unicode dizeleri için hiçbiri çalışmaz. Yazdırılamayan karakterleri bir unicode dizesinden kaldırmanın iyi bir yolu olan var mı?
89 java  string  unicode 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.