«character-encoding» etiketlenmiş sorular

Karakter kodlaması, karakterlerin bir bayt dizisi olarak temsil edilme biçimini ifade eder. Web için karakter kodlaması Kodlama Standardında tanımlanmıştır.

6
ASCII kodu 7 bit mi yoksa 8 bit mi?
Öğretmenim bana ASCII'nin 8 bitlik karakter kodlama şeması olduğunu söyledi. Ancak sadece 0-127 kodlar için tanımlanmıştır, yani 7-bit'e sığabilir. O halde ASCII bitinin aslında 7 bitlik kod olduğu tartışılamaz mı? Ve ASCII'nin 8 bitlik kod olduğunu söylerken ne demek istiyoruz?


10
UTF-8 kaç karakter kodlayabilir?
UTF-8'in 8 bit olması, en fazla 256 farklı karakter olabileceği anlamına gelmez mi? İlk 128 kod noktası ASCII'deki ile aynıdır. Ancak UTF-8'in milyon karaktere kadar destekleyebileceğini söylüyor? Bu nasıl çalışıyor?

3
JsonParseException: Geçersiz tırnaksız karakter ((CTRL-CHAR, kod 10)
org.apache.httpcomponentsJSON format verilerini API'ye gönderecek bir Rest API'yi kullanmaya çalışıyorum . Bu istisnayı anlıyorum: Nedeni: com.fasterxml.jackson.core.JsonParseException: Geçersiz tırnaksız karakter ((CTRL-CHAR, kod 10)): dizeye eklenmek için ters eğik çizgi kullanılarak öncelenmelidir. Bunun nedeni, ctrl-charJSON dizesine dahil edilmesidir. Bunu veya başka bir çözümü değiştirmenin bir yolu var mı?

7
MacRoman, CP1252, Latin1, UTF-8 ve ASCII arasındaki kodlama nasıl güvenilir bir şekilde tahmin edilir
İş yerinde, kodlamayla ilgili bazı çağrışımlar, felaketler veya felaketler olmadan hiçbir hafta geçmiyor gibi görünüyor. Sorun genellikle kodlamayı belirtmeden bir "metin" dosyasını güvenilir bir şekilde işleyebileceklerini düşünen programcılardan kaynaklanır. Ama yapamazsın. Bu nedenle, dosyaların artık *.txtveya ile biten isimlere sahip olmasının yasaklanmasına karar verildi *.text. Buradaki düşünce, bu uzantıların sıradan …

3
"& # 160;" "& nbsp;" yerine?
ASP.NET uygulamamda, boşluk çubuğu yazarak iki metin kutusu arasına birkaç beyaz boşluk eklemeye çalışıyordum. Eşdeğer HTML kaynağı  yerine  . Bu yüzden kontrol etmek istedim: bu, beyaz boşluğun yeni yerine mi geçiyor? Varsa, neden değiştikleri hakkında bir fikriniz var mı?

10
“Java.nio.charset.MalformedInputException: Giriş uzunluğu = 1” ten kaçınmak için her şey dahil Karakter Kümesi?
Java'da bir dizinin metin tabanlı dosyalarını okuyan basit bir wordcount programı oluşturuyorum. Ancak, şu hatayı almaya devam ediyorum: java.nio.charset.MalformedInputException: Input length = 1 bu kod satırından: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Muhtemelen bunu anladığımı biliyorum çünkü Charsetmetin dosyalarındaki bazı karakterleri içermeyen, bazıları diğer dillerin karakterlerini içeriyordu. Ama bu karakterleri dahil etmek …

2
Bir karakterde kaç bit veya bayt vardır? [kapalı]
Burada ne sorulduğunu söylemek zor. Bu soru belirsiz, belirsiz, eksik, aşırı geniş veya retoriktir ve mevcut haliyle makul bir şekilde cevaplanamaz. Yeniden açılabilmesi için bu sorunun netleştirilmesine yardımcı olması için yardım merkezini ziyaret edin . 9 yıl önce kapalı . "Karakter" başına kaç bit veya bayt vardır?

9
Python ile UTF8 CSV dosyası okumak
Python ile aksanlı karakterler içeren bir CSV dosyası okumaya çalışıyorum (sadece Fransızca ve / veya İspanyolca karakterler). Csvreader ( http://docs.python.org/library/csv.html ) için Python 2.5 belgelerine dayanarak , csvreader yalnızca ASCII'yi desteklediğinden, CSV dosyasını okumak için aşağıdaki kodu buldum. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode temporarily as …

6
Java'da Varsayılan Karakter Seti / Kodlama Nasıl Bulunur?
Açık cevap kullanmaktır, Charset.defaultCharset()ancak yakın zamanda bunun doğru cevap olmayabileceğini öğrendik. Bana sonucun java.io sınıfları tarafından birkaç durumda kullanılan gerçek varsayılan karakter setinden farklı olduğu söylendi. Görünüşe göre Java, 2 set varsayılan karakter kümesini tutuyor. Bu konuyla ilgili herhangi bir fikri olan var mı? Bir başarısızlık durumunu yeniden oluşturabildik. Bu …

6
Windows 10 komut isteminde git log çıktı kodlama sorunları
Sorun git logWindows komut isteminde komut çıktısının düzgün görüntülenmesini nasıl sağlayabilirim ? Misal Gördüğünüz gibi aksanlı karakterleri düzgün yazabiliyorum ama git logçıktı bir şekilde kaçtı. UTF-8Kodlama tablosuna göre çıktıdan gelen açılı parantezler ( <ve >) arasındaki kodlar önceden yazılan git configparametrelere karşılık gelir . LESSCHARSETOrtam değişkenini, benzer sorun için cevaplardan …

5
Python: ISO-8859-1 / latin1'den UTF-8'e dönüştürme
E-posta modülü ile Quoted-printable'dan ISO-8859-1'e kodu çözülmüş bu dizeye sahibim. Bu bana "\ xC4pple" gibi "Äpple" (İsveççe Apple) 'a karşılık gelen dizeler veriyor. Ancak, bu dizeleri UTF-8'e dönüştüremiyorum. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' …



7
Bayt dizisini String'e (Java) dönüştürme
Google app Engine'de bir web uygulaması yazıyorum. İnsanların .htmlblobstore'da bir dosya olarak saklanan html kodunu düzenlemelerine olanak tanır . Dosyadaki byte[]tüm karakterlerden bir döndürmek için fetchData kullanıyorum . Kullanıcının html kodunu düzenlemesi için bir html'ye yazdırmaya çalışıyorum. Her şey harika çalışıyor! Şu andaki tek sorunum şu: Bayt dizisi bir dizeye …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.