«character-encoding» etiketlenmiş sorular

ASCII, UTF-8, EBCDIC gibi karakterlerin ve karakter kümelerinin çeşitli gösterimleriyle ilgili sorular. Genellikle dosyaları satır başları ve / veya satırsonu karakterleri ile yeni satırları kodlayan işletim sistemleri arasında taşırken karşılaşılır.

4
ISO-dışı genişletilmiş ASCII metninden, CRLF satır sonlandırıcılı UTF-8'e kodlama nasıl değiştirilir?
Bir txt dosyam var: $ file -i x.txt x.txt: text/plain; charset=unknown-8bit $ file x.txt x.txt: Non-ISO extended-ASCII text, with CRLF line terminators Ve yanlış kodlanmış bazı karakterler var: trwa³y, sta³y, usuwaæ Bu dosyanın kodlamasını UTF-8 olarak nasıl değiştirebilirim? Şu ana kadar aşağıdaki yolu denedim: $ iconv -f ASCII -t UTF-8 …

4
özel karakterlere sahip dosyaları toplu olarak yeniden adlandırma (veya doğru görüntüleme)
Bu dosya gibi özel karakterler içeren dosyalar içeren dizinler ve alt dizinler bir grup var: robbie@phil:~$ ls test�sktest.txt test?sktest.txt Bul bir kaçış dizisi gösterir: robbie@phil:~$ find test�sktest.txt -ls 424512 4000 -rwxr--r-x 1 robbie robbie 4091743 Jan 26 00:34 test\323sktest.txt Konsolda isimlerini bile yazabilmemin tek nedeni sekme tamamlanması. Bu ayrıca onları …

2
Bir .docx dosyasını pandoc ile bir .pdf dosyasına dönüştürme
Ben pandoc (GNU / Linux kullanıyorum) kullanarak posta ile alınan bir .docx doğru bir pdf dönüştürmek çalışıyorum. Kodlama karakterleri ile ilgili bir hata var: $ pandoc file.docx -o file.pdf pandoc: Cannot decode byte '\x87': Data.Text.Encoding.decodeUtf8: Invalid UTF-8 stream Kodlamayı belirlemeye çalıştım: $ file -i file .docx file.docx: application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary Biraz …


3
Daha fazla, kedi ve daha azı tarafından desteklenen karakter kodlamaları
Aşağıdaki gibi kodlanmış bir metin dosyası var file: ISO-8859 metni, CRLF satır sonlandırıcıları ile Bu dosya aksanlı Fransızca metin içeriyor. Kabuğum aksanı görüntüleyebilir ve emacskonsol modunda bu aksanları doğru bir şekilde görüntüleyebilir. Benim sorunum olduğunu more, catve lessaraçlar bu dosyayı doğru göstermez. Sanırım bu araçlar bu karakterlerin kodlama setini desteklemediği …

6
İbranice adlara sahip dosyaların ZIP arşivini nasıl doğru şekilde açabilirim?
Birisi bana İbranice isimleri olan dosyaları içeren bir ZIP dosyası gönderdi (ve Windows'ta oluşturuldu, hangi araçla emin değilim). Debian Stretch'te LXDE kullanıyorum. Gnome arşiv yöneticisi dosyayı açmayı başarıyor, ancak İbranice karakterler bozuk. Ben düşünüyorum Adını dört karakterleri ve bir .doc suffic olan bir dosya var mesela ben, Unicode karakterleri içine …

1
Yabancı karakterler SSH'de görüntülenmiyor
Kullanmayla ilgili bazı sorunlar yaşıyorum sshve uzak bir sunucu (yönetici erişimim yok) - Özellikle, Korece ve Kiril metinleri olan birkaç klasör var. Üst klasör içeriğini ile görüntülediğimde ls, karakterler "?" Olarak çıkar. Belki de Korece karakterlerin orada olması gereken karakter sayısından çok daha fazla kaçtığı görülüyor . Kullandığım terminal programının …


2
ssh ve karakter kodlaması
Ne zaman ben sshbenim VPS içine, ben var irssiekranda çalışan. Birisi unicode karakter gönderdiğinde (örneğin © veya €), oturum irssisırasında ekrandan kullandığımda çöp görüntüler ssh. Buna irssiyerel bilgisayarımda çalışan irssi'nin proxy modülünü kullanarak bağlanırsam , doğru şekilde görüntüleniyor. Aynı şekilde, VPS'imde (ekranın dışında) ghci çalıştırıp bu karakterlerden birine girersem, kilitleniyor. …

3
UTF-8 ile `cut -c` (` --characters ') kullanılamaz mı?
Komutun cut, seçeneğe -csahip baytlar yerine karakterler üzerinde çalışma seçeneği vardır -b. Ancak bu, en_US.UTF-8yerel olarak çalışmıyor gibi görünüyor : İkinci bayt, ikinci ASCII karakterini verir (UTF-8'de aynı şekilde kodlanır): $ printf 'ABC' | cut -b 2 B ancak UTF-8 yerel ayarında üç Yunanca olmayan ASCII olmayan karakterin ikincisini vermez: …

3
Ascii karakterine ondalık bastırma, komutum istendiği gibi çıkmıyor
Aşağıdaki komutla tüm ascii karakterlerinin bir dizesini çıkarmak istedim for i in `seq 32 127`; do printf "%c" $i; done Yukarıdaki komutun çıktısı: 33333334444444444555555555566666666667777777777.............. Her sayının ilk (soldan) basamağıdır. Bu siteye baktığımda sorunumun cevabına rastladım CLI'da yazdırılabilir tüm ASCII karakterleri nasıl yazdırılır? ancak orijinal snippet'imin neden ascii karakterlerini amaçlandığı gibi …

2
iconv yasadışı giriş sırası- neden?
Bir metin dosyasını ASCII eşdeğerine dönüştürmeye çalışırken hata mesajı alıyorum iconv: illegal input sequence at position. Kullandığım komut iconv -f UTF-8 -t ascii//TRANSLIT file Rahatsız edici karakter æ. Metin dosyasının kendisi burada mevcuttur . Neden yasadışı dizilim diyor? Giriş karakteri uygun UTF-8 karakteridir (U + 00E6).


2
Html yerine ikili dönen wget?
Statik bir html sayfası indirmek için wget kullanıyorum. W3C Doğrulayıcı, sayfanın UTF-8 ile kodlandığını söylüyor. Yine de indirdikten sonra dosyayı cat ettiğimde, bir grup ikili saçmalık elde ediyorum. Ubuntu'dayım ve varsayılan kodlamanın UTF-8 olduğunu düşündüm. Yerel ayarımın söylediği bu. Bu neden oluyor ve nasıl düzeltebilirim? Ayrıca, benziyor Content-Encoding: gzip. Belki …

5
Firefox'ta yedek kodlamayı UTF-8 olarak nasıl ayarlayabilirim?
Bir Norveç markdown belgesi yazdım: $ file brukerveiledning.md brukerveiledning.md: UTF-8 Unicode text markdownKomutunu kullanarak HTML'ye dönüştürdüm : $ markdown > brukerveiledning.html < brukerveiledning.md $ file brukerveiledning.html brukerveiledning.html: UTF-8 Unicode text Ancak, Firefox ASCII olmayan karakterleri kırarak "windows-1252" kodlamasını kullanmakta ısrar ediyor . Yedek metin kodlamasını "Geçerli Yerel Ayar için Varsayılan" …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.