Mac OS X 10.8'de standart Western Mac OS Roman kodlamasında kaydedilmiş bir metin dosyasını daha genel UTF-8'e dönüştürme yeteneğini veren bir komut satırı yardımcı programını çağırmak istiyorum.
Yardımcı programı, oluşturduğum bir AppleScript'ten arayacağım. AppleScript, çok büyük metin bloklarıyla çalışırken son derece yavaştır. Bu nedenle, metin ayrıştırma ve dönüşümümü OS X komut satırını kullanarak yapmak istiyorum. Metin ayrıştırma yapmama izin veren "sed" adlı bir araç buldum. Bununla birlikte, dosyanın temizlenmesi gereken birçok öğe vardır, dosya utf-8 olarak açılırsa çöp gibi görünen karakterler vardır (örneğin akıllı tırnaklar ve elipsler).
Metin kodlama dönüştürme zorlama dosyadaki tüm utf8 olmayan karakterleri ortadan kaldırmak için yardımcı olabilir düşünüyorum. Ancak, "sed" metin kodlamasını nasıl kolayca dönüştürebilirsiniz göremiyorum.
MacRoman olarak temp txt dosyasını yerleşik AppleScript rutinlerini kullanarak diske zaten kaydetmiş olacağım.
Metin kodlamasını dönüştürebilen yerleşik bir komut satırı aracıyla ilgili herhangi bir fikriniz var mı? Performans ve yerleşik için komut satırı, çünkü komut dosyamın diğer kullanıcıları yerleşik değilse uygun araç setine sahip olmayacaklardır.
Yardımın için teşekkürler!