Dizelerim dosya yolları s/14/11/13/15/n7ce49B_235_25ed2d70.jpg; benim desenlerim oldukça basit, hepsi gibi n7ce49B_.+.
Koşuyorum GNU grep 2.6.3altında Debian 6.0.10 tarihinde Dell DL360G7 sunucusuna 15k HDD ve bu komutla (Sadece bu makine perfomance duygusu vermek için söz): time LC_ALL=C grep -E -f path_to_patterns_file path_to_strings_fileSadece tamamlanamıyor - sunucu takaslarını çok kötü. 20k desenleri ile 3 saatten fazla sürer.
Bu bana mantıksız geliyor.
Yorum isteği başına, dosyalar vardır: dosya yolları 20k kalıpları
Ayrıca, giriş çizgileri ve kalıplarının sayısını aşağıdakilerle test edebilir ve ayarlayabilirsiniz:
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 |
grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
grep.
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 | grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000). Normal ifadeleri derlemek ve çok fazla bellek ayırmak için zaman harcanmış gibi görünüyor. Bunun -Fyerine, -Eanlık.
n7ce49B_.+eşdeğer değiln7ce49B_.
90k, açıklamanın20Kdesenleri var