Programlama utf-8

14

Python'daki dosyalara Unicode (UTF-8) okuma ve yazma

Bir dosyaya metin okumayı ve yazmayı anlamada beyin yetmezliği yaşıyorum (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() 'Capit\xc3\xa1n\n' …

329 python unicode utf-8 io

24

Kodlamayı tespit edin ve her şeyi UTF-8 yapın

Çeşitli RSS beslemelerinden çok sayıda metin okuyorum ve bunları veritabanıma ekliyorum. Tabii ki, beslemelerde kullanılan birkaç farklı karakter kodlaması vardır, örneğin UTF-8 ve ISO 8859-1. Ne yazık ki, bazen metinlerin kodlanmasında sorunlar vardır. Misal: "Fußball" daki "ß", veritabanımda şöyle görünmelidir: "ÂŸ". Bir "ÂŸ" ise, doğru şekilde görüntülenir. Bazen, "Fußball" daki …

304 php encoding utf-8 character-encoding

5

UTF-8: Genel? Çöp Kutusu? Unicode?

Çeşitli veri türleri için hangi harmanlamayı kullanmam gerektiğini anlamaya çalışıyorum. Depolayacağım içeriğin% 100'ü kullanıcı tarafından gönderildi. Anladığım kadarıyla UTF-8 İkili yerine UTF-8 Genel CI (Büyük / Küçük Harfe Duyarsız) kullanmalıyım. Ancak UTF-8 Genel CI ve UTF-8 Unicode CI arasında net bir ayrım bulamıyorum. Kullanıcı tarafından gönderilen içeriği UTF-8 General veya …

279 mysql utf-8 collation

11

Bir dizenin unicode veya ascii olup olmadığını nasıl kontrol edebilirim?

Bir dizenin hangi kodlamasını kullandığını anlamak için Python'da ne yapmam gerekir?

271 python unicode encoding utf-8

16

ResourceBundle ile kaynak özelliklerinde UTF-8 nasıl kullanılır

Java kullanarak kaynak özellikleri UTF-8 kullanmanız gerekir ResourceBundle. Metni doğrudan özellikler dosyasına girdiğimde, mojibake olarak görüntülenir. Uygulamam Google App Engine'de çalışıyor. Biri bana bir örnek verebilir mi? Bu işi alamıyorum.

259 java google-app-engine utf-8 internationalization resourcebundle

14

BOM olmadan UTF-8'de dosya yazmak için PowerShell kullanma

Out-File UTF-8 kullanırken Malzeme Listesini zorladı gibi görünüyor: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath PowerShell kullanarak BOM olmadan UTF-8'de nasıl dosya yazabilirim?

246 encoding powershell utf-8 byte-order-mark

2

Url, Python'da UTF-8 kodunu çözüyor

Python'da acemi olduğum kadar çok zaman geçirdim. Böyle bir URL'nin kodunu nasıl çözebilirim: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 Python 2.7'de buna: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) çok çirkin bir şey döndürüyor. Hala çözüm yok, herhangi bir yardım takdir ediliyor.

245 python encoding utf-8 urldecode

11

Dize UTF-8 bayt []

Diyelim ki BufferedInputStreamUTF-8 kodlu bir metin dosyasının baytlarını bir bayt dizisine okumak için a kullandım . Ben bir dizeye bayt dönüştürmek için aşağıdaki rutin kullanabilirsiniz biliyorum, ama bunu sadece baytlar yineleme ve her birini dönüştürmekten daha etkili / daha akıllı bir yolu var mı? public String openFileToString(byte[] _bytes) { String …

243 java utf-8

17

UTF-8'i JDBC aracılığıyla MySQL'e eklemeye çalışırken “hatalı dize değeri”?

Bağlantım şöyle yapılır: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Tabloya satır eklemek için yazarken aşağıdaki hatayı alıyorum: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Binlerce kayıt ekliyorum ve metin \ xF0 (yani yanlış dize değeri her zaman \ xF0 ile başlar) içerdiğinde ben …

228 mysql jdbc utf-8 utf8mb4

16

'&' Kelimesini '& amp;' olarak kodlamam gerekiyor mu?

&Sitemin HTML5 ve UTF-8 ile bir ' ' sembolü kullanıyorum <title>. Google, başlıklarındaki tüm tarayıcılarda olduğu gibi, SERP'lerde ve işareti iyi gösteriyor. http://validator.w3.org bana bunu veriyor: & karakter başvurusu başlatmadı. (& muhtemelen kaçmış olmalıydı &amp;.) Gerçekten yapmam gerekiyor &amp;mu? Sayfalarımın doğrulanması amacıyla doğrulanmasından endişe etmiyorum, ancak insanların bu konudaki fikirlerini …

207 validation html utf-8 character-encoding

4

Python'da UTF-8 dosyasına yaz

İle gerçekten kafam karıştı codecs.open function. Ben yaparken: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Bana hata veriyor UnicodeDecodeError: 'ascii' codec bileşeni 0 konumunda bayt 0xef kodunun kodunu çözemiyor: sıra değeri aralıkta değil (128) Eğer yaparsam: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() İyi çalışıyor. Soru , ilk yöntem neden başarısız …

205 python utf-8 byte-order-mark

8

HTML kodlama sorunları - “& nbsp;” yerine “Â” karakteri görünüyor

Emin olmamakla birlikte, yanlış davranmaya başlayan eski bir uygulamam var. ActivePDF tarafından PDF raporlarına dönüştürülen bir grup HTML oluşturur. İşlem şu şekilde çalışır: Değiştirilecek jetonları olan bir DB'den bir HTML şablonu çekin (örn. "~ CompanyName ~", "~ CustomerName ~", vb.) Jetonları gerçek verilerle değiştirin HTML kod özniteliği değerlerini biçimlendiren basit …

204 html vb.net encoding utf-8 iso-8859-1

12

PHP DOMDocument loadHTML, UTF-8'i doğru kodlamıyor

Ben DOMDocument kullanarak bazı HTML ayrıştırmak için çalışıyorum, ama bunu yaptığımda aniden kodumu (en azından bana böyle görünüyor) kaybederim. $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Bu kod sonucu Japonca olmayan bir sürü karakter elde olmasıdır. …

195 php utf-8 character-encoding

9

Python'da bir dizeyi utf-8'e dönüştürme

Python sunucuma utf-8 karakter gönderen bir tarayıcı var, ancak sorgu dizesinden aldığımda, Python döndürdüğü kodlama ASCII olduğunu. Düz dizeyi utf-8'e nasıl dönüştürebilirim? Not: Web'den geçirilen dize zaten UTF-8 kodlu, ben sadece Python ASCII değil UTF-8 olarak tedavi etmek istiyorum.

193 python python-2.7 unicode utf-8

30

PHP'de Excel'in düzgün okuyacağı bir UTF-8 CSV çıktısını nasıl alabilirim?

Ben sadece CSV formatında bazı şeyler çıktı bu çok basit bir şey var, ama UTF-8 olması gerekir. Bu dosyayı TextEdit veya TextMate veya Dreamweaver'da açıyorum ve UTF-8 karakterlerini düzgün bir şekilde gösteriyor, ancak Excel'de açarsam bunun yerine aptalca bir şey yapıyor. Dokümanımın başında ne var: header("content-type:application/csv;charset=UTF-8"); header("Content-Disposition:attachment;filename=\"CHS.csv\""); Excel'in (Mac, 2008) …

191 php csv utf-8 byte-order-mark

«utf-8» etiketlenmiş sorular