«character-encoding» etiketlenmiş sorular

ASCII, UTF-8, EBCDIC gibi karakterlerin ve karakter kümelerinin çeşitli gösterimleriyle ilgili sorular. Genellikle dosyaları satır başları ve / veya satırsonu karakterleri ile yeni satırları kodlayan işletim sistemleri arasında taşırken karşılaşılır.

3
LANG ayarlarken bir Şarap uygulamasında Rusça harfleri nasıl düzeltir?
Rus kullanıcı arayüzü olan bir uygulama, metninin çoğunda soru işaretlerini gösterir (bazı öğeler olsa da tamamlanır). Sistem yerel ayarı İngilizce (en_US, en_IE), Ubuntu ant XUbuntu 12.04 ile Wine 1.5'i denedim. İle uygulamayı başlatmayı denedim LANG=ru_RU.utf8 wine myapp.exe ama yardımcı olmuyor. Ayrıca ttf-mscorefonts-installeryüklü olduğunu da kontrol ettim . Windows'u kullanırsam, Denetim …

2
Linux'ta dosya sistemi karakter kodlaması hakkında birkaç soru
Windows ( GBK kodlaması) ve Linux ( UTF-8 kodlaması) arasında çok sayıda dosya değişimi çalışması nedeniyle, kolayca karakter kodlama sorunlarıyla karşılaşacaktır, örneğin: Windows sisteminde adı Çince karakterler içeren zip / tar dosyaları, Linux sisteminde unzip / untar. GBK kodlaması adlı dosyaları diske yazan taşınan eski java web uygulamasını (Windows sisteminde …

2
Wc -m ve wc -c neden farklı?
Bir C programcısı olarak, wc -c(bayt wc -msayısını sayan ) ve (karakter sayısını sayan) uzun bir metin dosyam için çok farklı sonuçlar verdiğini görünce şaşırdım . Her zaman sizeof(char)1 bayt olduğu söylenmişti . qdii@nomada ~/Documents $ wc -c sentences.csv 102990983 sentences.csv qdii@nomada ~/Documents $ wc -m sentences.csv 89023123 sentences.csv Herhangi …

2
Hangi karakter kodlamaları posix tarafından desteklenir?
POSIX gibi araçlar davranışını tanımlar grep, awk, sedvb metin dosyalarına karşı hangi çalışma. Bir metin dosyası olduğundan, karakter kodlama sorunları olduğunu düşünüyorum. Soru: POSIX tarafından desteklenen karakter kodlamaları nedir? (veya POSIX compiant sistemleri tarafından hangi kodlamanın metin dosyaları işlenebilir?)

4
lpr ile utf-8 kodlaması desteği
Aracılığıyla yazıcıya bir metin dosyası göndermeye çalışırken lprgelen xterm, içerik sebebi olan sonuçta dosyanın kodlama kadar takip edildi, tanınmayacak kadar bozuktur. Bunun yerine metni iconv(örn. iconv -f utf-8 -t ascii//TRANSLIT) İle işlersem, dosya normal olarak yazdırılır. Karşılaştığım başka bir öneri de belge biçimini (örn. lpr -o document-format=text/utf8) Ayarlamaktır , ancak …

2
terminal: özel karakterleri görüntüleme
htopÇizgiler ve çerçeveler gibi bazı programlarda düzgün görüntülenmez. Bunun yerine -ve olarak görüntülenirler /. Ancak başka bir makinede, doğru çizgiler olarak doğru şekilde görüntülenirler: Bunun bir terminal sorunu olup olmadığından veya bazı paketlerin gerekli olduğundan emin değilim. İlgili olması durumunda: Sistemim Debian Wheezy, tercümanım bashve terminal öykünücümgnome-terminal

3
$ LANG'ın terminal üzerindeki etkisi
Değişkenin gnome terminali (ve karakter kodlama tercih seçeneği) ile nasıl davrandığını öğrenmeye çalışıyorum $LANG. Ana karakter setim olarak iso8859-1 (latin1) kullanıyorum ve tüm dosya adlarım bu şekilde kodlandı. Aşağıdaki testler ls -liçin dosya adlarında İspanyolca aksanlı karakterler içeren bir dizini yapacağım : Dava 1: gnome terminali ISO-8859-1 için yapılandırılmıştır LANG …

1
Dosya adlarım neden Linux'ta 'normal' görünüyor, ancak Windows'da uzaktan görünmüyor?
Bir meslektaşımla çalışırken kodlamayla ilgili görünen garip bir sorun buldum. Biz gibi basit yeterince dosya adlarına sahip bazı görüntülerle çalışıyoruz city.gifya wine.gif, ama bir tahmin edebileceğiniz gibi gibi özel karakterleri kullanırken şeyler daha karmaşık hale geldiğini é, ë, à. Ayrıca bu karakterlere sahip Hollandaca verilerle de çalışıyoruz, örn. café( Pub …

2
Libreoffice ile kodlamayı belirtin --convert-to csv
Excel dosyaları aşağıdakiler kullanılarak CSV'ye dönüştürülebilir: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Her şey gayet iyi çalışıyor. Kodlama yine de sakat bir şeye ayarlanmıştır. LibreOffice Calc'den manuel olarak "farklı kaydet" yaparsam alacağım UTF-8 mdash (-) yerine, bana bir \ 227 ( ) verir. CSV'de dosya kullanmak bana "ISO …

1
Bazı uygulamalar «Oluştur» tuşundan bazı karakterleri kabul etmez
Sorun, oluşturma anahtarının iyi çalışması, ancak bazı uygulamaların bazı karakterleri kabul etmemesi. Örneğin, karakteri ∞Emacs ( Compose+ 8+ 8) olarak yazabilirim , ancak bu FireFox, Konsole ve Kate'te çalışmaz. Ancak , Compose ile €oraya yazılan diğer pek çok karakter (FireFox, Konsole ve Kate'te) gayet iyi çalışıyor. Ayrıca basit bir kopyala …


4
Garip bir karakteri nasıl tanımlayabilirim?
Çalıştığım bir dosyada bulduğum garip bir karakteri belirlemeye çalışıyorum: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 Dosya ISO-8859 kodlaması kullanıyor ve UTF-8 biçimine dönüştürülemiyor: $ iconv -f ISO-8859 -t UTF-8 file iconv: …

2
dosya adında özel karakter (\ # 033OA)
Bir rsync sırasında çok inatçı bir hatayla ilgili küçük bir problemim var. Dosya adında özel karakterli bir dosyadan kaynaklanır. Başkaları da vardı ama bunu dosya adının kodlamasında bir dönüşüm yaparak çözebilirim. Ancak bu dosyayı bile bulamıyorum. İşte rsync şöyle diyor: ../.\#033OA.tex.pyD0MB" failed: No such file or directory (2) İlk şey …


2
Terminalde garip karakterler olmamasını önlemek için yerel ayarları / kodlamayı nasıl değiştirebilirim?
treeUbuntu kutuma yükledim , Putty'den bağlandığımda ve başlattığımda bunu alıyorum tree: $ tree âââ html.vim -> xml.vim âââ js.vim -> xml.vim âââ xml.vim bunun yerine : $ tree --charset=ANSII |-- html.vim -> xml.vim |-- js.vim -> xml.vim `-- xml.vim Bu sorunu, örneğin paketlerimi listelediğimde de alıyorum npm(paket yöneticisi nodejs) $ …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.