Kabaca bu kodu kullanarak, bir metinden stop kelimeleri kaldırıyorum
Aşağıdakilere sahibim
$ cat file
file
types
extensions
$ cat stopwords
i
file
types
grep -vwFf stopwords file
Sonuç bekliyorum:
extensions
ama anladım (yanlış düşünüyorum)
file
extensions
Sanki file
kelime stopwords dosyasında atlanmış gibi. Şimdi burada serin biraz: Ben tek bir kelime / harf değiştirerek, engellenecek kelimeler dosyasını değiştirirseniz i
dışında başka herhangi bir ASCII mektuba, ilk satırda f
, i
, l
, e
, daha sonra aynı grep komutu Bana farklı ve doğru sonucu verir extensions
.
Burada neler oluyor ve nasıl düzeltebilirim?
Mac OSX GNU bash, sürüm 4.4.12 (1) üzerinde grep (BSD grep) 2.5.1-FreeBSD kullanıyorum
i
Deseni stopwords
dosyadaki ilk desen yerine ikinci yapmak da davranışı değiştirir.
grep
veya GNU grep
3.1 ile çoğaltamıyorum .
-x
Anahtar yerine-w
word yerine line regex için kullanmak isteyebilirsiniz ? Ancak-F
anahtarın ikisini de iptal edeceğini ya da tam tersini düşünüyorum.