İlgili, ancak tatmin edici bir cevap yok: Büyük bir metin dosyasını 500 kelimelik parçalara nasıl bölebilirim?
Ben bir satırda> 10 ^ 7 kelime ile bir metin dosyası ( http://mattmahoney.net/dc/text8.zip ) almak ve her N kelime ile satırlara bölmek çalışıyorum. Mevcut yaklaşımım işe yarıyor, ancak oldukça yavaş ve çirkin (kabuk komut dosyası kullanarak):
i=0
for word in $(sed -e 's/\s\+/\n/g' input.txt)
do
echo -n "${word} " > output.txt
let "i=i+1"
if [ "$i" -eq "1000" ]
then
echo > output.txt
let "i=0"
fi
done
Bunu nasıl daha hızlı veya daha kompakt hale getirebileceğime dair bir ipucu var mı?