«utf-8» etiketlenmiş sorular

UTF-8, bir ila dört baytlık bir bayt dizisi kullanarak her Unicode kod noktasını tanımlayan bir karakter kodlamasıdır. Tüm Unicode kod noktalarının gösterilmesini desteklerken ASCII ile geriye dönük uyumludur.

14
Python'daki dosyalara Unicode (UTF-8) okuma ve yazma
Bir dosyaya metin okumayı ve yazmayı anlamada beyin yetmezliği yaşıyorum (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() 'Capit\xc3\xa1n\n' …
329 python  unicode  utf-8  io 

24
Kodlamayı tespit edin ve her şeyi UTF-8 yapın
Çeşitli RSS beslemelerinden çok sayıda metin okuyorum ve bunları veritabanıma ekliyorum. Tabii ki, beslemelerde kullanılan birkaç farklı karakter kodlaması vardır, örneğin UTF-8 ve ISO 8859-1. Ne yazık ki, bazen metinlerin kodlanmasında sorunlar vardır. Misal: "Fußball" daki "ß", veritabanımda şöyle görünmelidir: "Ÿ". Bir "Ÿ" ise, doğru şekilde görüntülenir. Bazen, "Fußball" daki …

5
UTF-8: Genel? Çöp Kutusu? Unicode?
Çeşitli veri türleri için hangi harmanlamayı kullanmam gerektiğini anlamaya çalışıyorum. Depolayacağım içeriğin% 100'ü kullanıcı tarafından gönderildi. Anladığım kadarıyla UTF-8 İkili yerine UTF-8 Genel CI (Büyük / Küçük Harfe Duyarsız) kullanmalıyım. Ancak UTF-8 Genel CI ve UTF-8 Unicode CI arasında net bir ayrım bulamıyorum. Kullanıcı tarafından gönderilen içeriği UTF-8 General veya …
279 mysql  utf-8  collation 




2
Url, Python'da UTF-8 kodunu çözüyor
Python'da acemi olduğum kadar çok zaman geçirdim. Böyle bir URL'nin kodunu nasıl çözebilirim: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 Python 2.7'de buna: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) çok çirkin bir şey döndürüyor. Hala çözüm yok, herhangi bir yardım takdir ediliyor.

11
Dize UTF-8 bayt []
Diyelim ki BufferedInputStreamUTF-8 kodlu bir metin dosyasının baytlarını bir bayt dizisine okumak için a kullandım . Ben bir dizeye bayt dönüştürmek için aşağıdaki rutin kullanabilirsiniz biliyorum, ama bunu sadece baytlar yineleme ve her birini dönüştürmekten daha etkili / daha akıllı bir yolu var mı? public String openFileToString(byte[] _bytes) { String …
243 java  utf-8 

17
UTF-8'i JDBC aracılığıyla MySQL'e eklemeye çalışırken “hatalı dize değeri”?
Bağlantım şöyle yapılır: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Tabloya satır eklemek için yazarken aşağıdaki hatayı alıyorum: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Binlerce kayıt ekliyorum ve metin \ xF0 (yani yanlış dize değeri her zaman \ xF0 ile başlar) içerdiğinde ben …
228 mysql  jdbc  utf-8  utf8mb4 

16
'&' Kelimesini '& amp;' olarak kodlamam gerekiyor mu?
&Sitemin HTML5 ve UTF-8 ile bir ' ' sembolü kullanıyorum <title>. Google, başlıklarındaki tüm tarayıcılarda olduğu gibi, SERP'lerde ve işareti iyi gösteriyor. http://validator.w3.org bana bunu veriyor: & karakter başvurusu başlatmadı. (& muhtemelen kaçmış olmalıydı &.) Gerçekten yapmam gerekiyor &mu? Sayfalarımın doğrulanması amacıyla doğrulanmasından endişe etmiyorum, ancak insanların bu konudaki fikirlerini …

4
Python'da UTF-8 dosyasına yaz
İle gerçekten kafam karıştı codecs.open function. Ben yaparken: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Bana hata veriyor UnicodeDecodeError: 'ascii' codec bileşeni 0 konumunda bayt 0xef kodunun kodunu çözemiyor: sıra değeri aralıkta değil (128) Eğer yaparsam: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() İyi çalışıyor. Soru , ilk yöntem neden başarısız …

8
HTML kodlama sorunları - “& nbsp;” yerine “” karakteri görünüyor
Emin olmamakla birlikte, yanlış davranmaya başlayan eski bir uygulamam var. ActivePDF tarafından PDF raporlarına dönüştürülen bir grup HTML oluşturur. İşlem şu şekilde çalışır: Değiştirilecek jetonları olan bir DB'den bir HTML şablonu çekin (örn. "~ CompanyName ~", "~ CustomerName ~", vb.) Jetonları gerçek verilerle değiştirin HTML kod özniteliği değerlerini biçimlendiren basit …

12
PHP DOMDocument loadHTML, UTF-8'i doğru kodlamıyor
Ben DOMDocument kullanarak bazı HTML ayrıştırmak için çalışıyorum, ama bunu yaptığımda aniden kodumu (en azından bana böyle görünüyor) kaybederim. $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Bu kod sonucu Japonca olmayan bir sürü karakter elde olmasıdır. …

9
Python'da bir dizeyi utf-8'e dönüştürme
Python sunucuma utf-8 karakter gönderen bir tarayıcı var, ancak sorgu dizesinden aldığımda, Python döndürdüğü kodlama ASCII olduğunu. Düz dizeyi utf-8'e nasıl dönüştürebilirim? Not: Web'den geçirilen dize zaten UTF-8 kodlu, ben sadece Python ASCII değil UTF-8 olarak tedavi etmek istiyorum.

30
PHP'de Excel'in düzgün okuyacağı bir UTF-8 CSV çıktısını nasıl alabilirim?
Ben sadece CSV formatında bazı şeyler çıktı bu çok basit bir şey var, ama UTF-8 olması gerekir. Bu dosyayı TextEdit veya TextMate veya Dreamweaver'da açıyorum ve UTF-8 karakterlerini düzgün bir şekilde gösteriyor, ancak Excel'de açarsam bunun yerine aptalca bir şey yapıyor. Dokümanımın başında ne var: header("content-type:application/csv;charset=UTF-8"); header("Content-Disposition:attachment;filename=\"CHS.csv\""); Excel'in (Mac, 2008) …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.