UTF-8'de birden fazla dilde metinler içeren bir dosyam var. Bunların çoğu insanların isimleri. ASCII'ye dönüştürmem gerekiyor ve mümkün olduğu kadar iyi görünmek için sonuca ihtiyacım var.
Daha geniş bir kodlamadan daha dar bir kodlamaya dönüştürme yaklaşımının birçok yolu vardır. En basit dönüşüm, ASCII dışındaki tüm karakterleri '_' gibi bazı yer tutucularla değiştirmek olacaktır. Dosyanın yazıldığı dili biliyorsanız, romanlaştırma gibi ek olasılıklar vardır.
Unix'te bulunan hangi Unix aracı veya programlama dili kütüphanesi UTF-8'den ASCII'ye bana iyi (en iyi çaba) dönüşümünü sağlayabilir?
Metnin çoğu Avrupa dillerinde latin dillerinde yazılmıştır.
iconv
ve tr
vardır Unidecode . Buna aşina değilim, ancak Python kullanıyorsanız, istediğinizi yapabilir.