FF FE
Malzeme Listesiyle birlikte bir .csv dosyası aldım :
$ head -n1 dotan.csv | hd
00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.|
awk
Ayrıştırmak için kullanırken bayt sırasından kaynaklandığından şüphelendiğim bir sürü boş bayt alıyorum. Normal dosyaların çalışabilmesi için bu dosyadaki (CLI'yi kullanarak) bayt sırasını nasıl değiştirebilirim?
Bu dosyanın (BOM hariç) sadece ASCII karakterler olduğunu grep
düşünüyorum, ancak ikili bir dosya olduğunu düşünüyor gibi teyit edemez :
$ grep -P '^[\x00-\x7f]' dotan.csv
Binary file dotan.csv matches
VIM'de aynı dizeyi aramak her karakter eşleşmesini gösterir !
iconv
ASCII'ye dönüştürmek için kullanmak \ x00 değerlerinden kurtulmaz, aslında UTF-8 yerine null bayt gibi göründükleri için problemi daha da kötüleştirir!
$ iconv -f UTF-8 -t ASCII dotan.csv > fixed.txt
iconv: illegal input sequence at position 0
$ iconv -f UTF-8 -t ASCII//IGNORE dotan.csv > fixed.txt
$ head -n1 fixed.txt | hd
00000000 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 70 00 |A.d. .g.r.o.u.p.|
Normal dosyaların çalışabilmesi için bu dosyadaki (CLI'yi kullanarak) bayt sırasını nasıl değiştirebilirim?