Dizelerim dosya yolları s/14/11/13/15/n7ce49B_235_25ed2d70.jpg
; benim desenlerim oldukça basit, hepsi gibi n7ce49B_.+
.
Koşuyorum GNU grep 2.6.3
altında Debian 6.0.10 tarihinde Dell DL360G7 sunucusuna 15k HDD ve bu komutla (Sadece bu makine perfomance duygusu vermek için söz): time LC_ALL=C grep -E -f path_to_patterns_file path_to_strings_file
Sadece tamamlanamıyor - sunucu takaslarını çok kötü. 20k desenleri ile 3 saatten fazla sürer.
Bu bana mantıksız geliyor.
Yorum isteği başına, dosyalar vardır: dosya yolları 20k kalıpları
Ayrıca, giriş çizgileri ve kalıplarının sayısını aşağıdakilerle test edebilir ve ayarlayabilirsiniz:
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 |
grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
grep
.
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 | grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
. Normal ifadeleri derlemek ve çok fazla bellek ayırmak için zaman harcanmış gibi görünüyor. Bunun -F
yerine, -E
anlık.
n7ce49B_.+
eşdeğer değiln7ce49B_.
90k
, açıklamanın20K
desenleri var