[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
"" Sunucu "": 8 GByte RAM + 16 GByte SWAP, x> 300 GByte boş alan, amd64, masaüstü CPU. Bilimsel Linux 6.6. LOAD yapmak için başka hiçbir şey üzerinde çalışmaz. Awk birkaç saniye sonra durur .. out.txt ~ 1.6 GByte. GNU Awk 3.1.7.
Soru : Satırların sırasını korurken yinelenen satırları nasıl kaldırabilirim? Durum da önemlidir, örneğin: "A" ve "a" iki farklı çizgidir, tutmak zorunda. Ancak "a" ve "a" birbirinin aynısıdır, sadece ilki gereklidir.
Cevap herhangi bir şey olabilir .. awk bunun için iyi değilse .. o zaman perl / sed .. sorun ne olabilir?
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
Güncelleme: Bunu bir RHEL makinesinde denedim, durmuyor, ancak bitmesini beklemek için zamanım olmadı .. SL linux neden RHEL'den farklı değil?
Güncelleme: Ubuntu 14 sanal tahminleri deniyorum .. şimdiye kadar çalışıyor! Bu bir ulimit sorunu değil: mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
İki makinedeki sürümler nelerdir ?
out.txt
? Daha küçük bir dosyada denerseniz aynı komut çalışır mı? Makinede kaç kullanıcı var? İşlem için yeterli bellek var mıydı? Giriş dosyasının 8547098 satırıyla ilgili özel bir şey var mı?