Linux'ta çok sayıda dosya içeren bir dizinim var. Bazılarının ASCII olmayan karakterleri vardır, ancak hepsi geçerli UTF-8'dir . Bir program, ASCII olmayan dosya adlarıyla çalışmasını engelleyen bir hataya sahiptir ve kaç tanesinin etkilendiğini bulmak zorundayım. Bunu ASCII olmayan karakterleri yazdırmak için find
bir grep yapacağım ve sonra wc -l
numarayı bulmak için bir yapacağım. Grep olmak zorunda değil; Ben herhangi bir standart Unix kullanabilirsiniz düzenli ifade gibi, Perl , sed , AWK vb
Ancak, 'ASCII karakteri olmayan herhangi bir karakter' için düzenli bir ifade var mı?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]