Intel (R) Pentium (R) CPU G640 @ 2,80 GHz ve 8 GB RAM'e sahip bir PC'm var. Üzerinde EXT3 dosya sistemi olan Scientific Linux 6.5 kullanıyorum.
Bu kurulumda sort -u
200 gigabaytlık bir dosyada yapabileceğim en hızlı yöntem nedir?
Dosyayı daha küçük dosyalara bölmeli miyim (8 GB'tan küçük), sort -u
onları bir araya getirmeli, sonra tekrar farklı bir boyutta sort -u
, vb. Yeniden bölmeli miyim? Veya sınırlı miktarda RAM'imle bu kadar büyük dosyaları işleyebilecek herhangi bir sıralama komut dosyası veya programı var mı?
parallel
için GNU'ya ihtiyacınız olacak, bence parallel
bazı sistemlerde varsayılan olarak yüklenen moreutils yerine .
sort(1)
uzayda biterse /tmp
; öyleyse, geçici değişkenler için ortam değişkeniyle TMPDIR
veya -T=<tmpdir>
/tmp
.