«character-encoding» etiketlenmiş sorular

ASCII, UTF-8, EBCDIC gibi karakterlerin ve karakter kümelerinin çeşitli gösterimleriyle ilgili sorular. Genellikle dosyaları satır başları ve / veya satırsonu karakterleri ile yeni satırları kodlayan işletim sistemleri arasında taşırken karşılaşılır.

2
VIM'in varsayılan kodlamasını UTF-8 olarak nasıl ayarlayabilirim?
Tercüme edilmiş dizeleri sağlayan açık kaynaklı bir projeye katkıda bulunmak istiyorum. Gereksinimlerinden biri, katılımcıların PO dosyalarının kodlaması için UTF-8 kullanması gerektiğidir. Linux üzerinde VIM 7.3 kullanıyorum. VIM'in kodlamasının UTF-8 olarak ayarlandığından nasıl emin olabilirim, böylece .po dosyasını doğru şekilde düzenleyip kaydedebilirim?

6
Geçersiz utf8 filtreleme
Bilinmeyen veya karışık kodlamada bir metin dosyasına sahibim. UTF-8 geçerli olmayan bir bayt dizisi içeren satırları görmek istiyorum (metin dosyasını bir programa aktararak). Eşdeğer olarak, geçerli UTF-8 olan satırları filtrelemek istiyorum. Başka bir deyişle, arıyorum .grep [notutf8] İdeal bir çözüm taşınabilir, kısa ve diğer kodlamalara genelleştirilebilir olacaktır, ancak en iyi …

4
^ M karakteri ne denir?
TexPad onu yaratıyor. Bazı ölülerin altında olduğunu biliyorum. Sadece adını hatırlayamıyorum. Mavi karakter: Sadece onları belgelerimden çıkarmak istiyorum. Nasıl yazabilirsiniz?

3
Bir metin dosyasının kodlamasını nasıl test edebilirim… Geçerli mi ve nedir?
Herhangi bir uyarı / hata olmadan Gedit'te.htm açan birkaç dosyam var , ancak bu dosyaları açtığımda Jeditgeçersiz UTF-8 kodlaması konusunda beni uyarıyor ... HTML meta etiketi "charset = ISO-8859-1" ifadesini belirtir. Jedit , geri dönüş kodlamalarının bir listesini ve kodlama otomatik dedektörlerinin bir listesini (şu anda "BOM XML-PI") sağlar, bu …

4
bir dosyaya eko bayt
Rasberry Pi'mi i2c veriyolunu kullanarak bir ekrana bağlamaya çalışıyorum. Başlamak için, özellikle bir dosyaya el ile şeyler, baytlar yazmak istedim. Bir dosyaya belirli baytları nasıl yazarsınız? Bunu çoktan okudum ve sorunumun böyle bir şeyle çözülmesi gerektiğini düşündüm echo -n -e \x66\x6f\x6f > byteFileForNow Ancak, o dosyayı nano ile açtığımda , …

3
Linux'ta dosya adları ve yollar için hangi karakter kümesi kodlaması kullanılır?
Hangi dosya sistemini kullandığıma bağlı mı? Örneğin, ext2 / ext3 / ext4, aynı zamanda ISO 9660'lı "joliet" CD-ROM'larından birini yerleştirdiğimde ne olur? POSIX'in dosya adlarının karakter kümesi kodlaması için bir tür özellik içerdiğini duydum? Aslında, merak ettiğim şey UTF-8 kodlu bir dosya adımın olması durumunda, Linux'ta bir dosya giriş / …

2
Bulun (1): Bazı dosya adlarında başarısız olması için uygulanan yıldız joker karakter nasıl?
Dosya adlarının UTF-8’de olduğu bir dosya sisteminde, hatalı bir adla bir dosyam var; şöyle gösterilir:, D�sinstallerzsh: 'e göre gerçek ad D$'\351'sinstaller, Latin1 Désinstaller, kendisi için "kaldır" için bir Fransız barbarlığı. Zsh, onunla eşleşmeyecek, [[ $file =~ '^.*$' ]]ancak bir *dünya ile eşleşecekti - beklediğim davranış bu. Şimdi hala çalışırken bulmayı …


5
Chrome'da neden bazı karakterler kare olarak gösteriliyor?
Örneğin, geliştirme araçlarında şöyle bir şey alıyorum: Bu karelerin bazıları satırların sonunda, başlangıçta taşıma dönüşü olduklarını düşündüm ama olmadıkları ortaya çıktı. Ayrıca kareler sonra görünen =veya >hiçbir satır ve bir onaltılık editörü gösterir dosyasına bakan nerede arasındaki tüm herhangi bir karakter olmadığını birçok yerde =ve "(örn id="olarak gösteriliyor id=? ") …

3
Unix dosya adı kodlamasını anlama
Dosya adı kodlamasının nasıl çalıştığını anlamakta zorlanıyorum. Unix.SE'de çelişkili açıklamalar buluyorum. Dosya adları karakter olarak saklanır Başka bir cevap alıntı yapmak için: Linux'ta dosya sistemi karakter kodlaması hakkında birkaç soru […] Sorunuzda bahsettiğiniz gibi, bir UNIX dosya adı sadece bir karakter dizisidir; çekirdek, tamamen bir kullanıcı-alanı (yani uygulama seviyesi) konsepti …

2
tr “Yasadışı bayt sekansı” şikayetleri
UNIX için yepyeni yaşıyorum ve Kirk McElhearn'ün "Mac OS X Komut Satırı" nı kendime bazı komutlar vermek için kullanıyorum. Kullanmaya çalışıyorum trve grepnormal bir MS-Office Word Belgesinde metin dizeleri arayabilirim. $ tr '\r' '\n' < target-file | grep search-string Ancak geri döndüren tek şey: Illegal byte sequence. robomechanoid:Position-Paper-Final-Draft robertjralph$ tr …

4
dosya adında ASCII olmayan veya yazdırılamayan karakter içeren dosyaları tanımlama
Yaklaşık 700.000 dosya içeren 80 GB boyutundaki bir dizinde, dosya adında İngilizce olmayan karakterlere sahip bazı dosya adları vardır. Zahmetli bir şekilde dosya listesinde trol atmanın dışında: Bu dosya adlarını listelemek veya tanımlamak için kolay bir yol mu? Yazdırılabilir İngilizce olmayan karakter karakterleri oluşturmanın bir yolu - yazdırılabilir aralıkta listelenmeyen …


5
UTF-8 dosyasını ASCII'ye dönüştürme (en iyi çaba)
UTF-8'de birden fazla dilde metinler içeren bir dosyam var. Bunların çoğu insanların isimleri. ASCII'ye dönüştürmem gerekiyor ve mümkün olduğu kadar iyi görünmek için sonuca ihtiyacım var. Daha geniş bir kodlamadan daha dar bir kodlamaya dönüştürme yaklaşımının birçok yolu vardır. En basit dönüşüm, ASCII dışındaki tüm karakterleri '_' gibi bazı yer …

6
Rasgele bir şifre oluşturma; bu neden taşınabilir değil?
Rasgele bir şifre oluşturmak istiyorum ve bunu şöyle yapıyorum: </dev/urandom tr -dc [:print:] | head -c 64 Ubuntu'yu çalıştıran dizüstü bilgisayarımda bu, yalnızca istendiği gibi yazdırılabilir karakterler üretiyor. Fakat Red Hat Enterprise Linux çalıştıran okulumun sunucusuna ssh atıp orada çalıştırdığımda 3!ri�b�GrӴ��1�H�<�oM����&�nMC[�Pb�|L%MP�����9��fL2q���IFmsd|l�K, hiç yapmayacak gibi çıktılar alıyorum . Burada yanlış giden …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.