Kabaca bu kodu kullanarak, bir metinden stop kelimeleri kaldırıyorum
Aşağıdakilere sahibim
$ cat file
file
types
extensions
$ cat stopwords
i
file
types
grep -vwFf stopwords file
Sonuç bekliyorum:
extensions
ama anladım (yanlış düşünüyorum)
file
extensions
Sanki filekelime stopwords dosyasında atlanmış gibi. Şimdi burada serin biraz: Ben tek bir kelime / harf değiştirerek, engellenecek kelimeler dosyasını değiştirirseniz idışında başka herhangi bir ASCII mektuba, ilk satırda f, i, l, e, daha sonra aynı grep komutu Bana farklı ve doğru sonucu verir extensions.
Burada neler oluyor ve nasıl düzeltebilirim?
Mac OSX GNU bash, sürüm 4.4.12 (1) üzerinde grep (BSD grep) 2.5.1-FreeBSD kullanıyorum
iDeseni stopwordsdosyadaki ilk desen yerine ikinci yapmak da davranışı değiştirir.
grepveya GNU grep3.1 ile çoğaltamıyorum .
-xAnahtar yerine-wword yerine line regex için kullanmak isteyebilirsiniz ? Ancak-Fanahtarın ikisini de iptal edeceğini ya da tam tersini düşünüyorum.