linux – 使用grep过滤掉一个停用词文件中的单词

linux – 使用grep过滤掉一个停用词文件中的单词,第1张

概述我想使用grep和一个stopwords文件来过滤掉另一个文件中的常用英语单词.文件“somefile”每行包含一个单词. cat somefile | grep -v -f stopwords 这种方法的问题是:它检查某些文件中是否出现停用词中的单词,但我想要相反,即检查某些文件中的单词是否出现在停用词中. 这该怎么做? 例 somefile包含以下内容: hellooorange 停用词包 我想使用grep和一个stopwords文件来过滤掉另一个文件中的常用英语单词.文件“somefile”每行包含一个单词.
cat somefile | grep -v -f stopwords

这种方法的问题是:它检查某些文件中是否出现停用词中的单词,但我想要相反,即检查某些文件中的单词是否出现在停用词中.

这该怎么做?

somefile包含以下内容:

hellooorange

停用词包含以下内容:

o

我想从somefile中过滤掉单词“o”,而不是hello和orange.

解决方法 我想了一下,找到了解决方案……

使用grep的-w开关来匹配整个单词:

grep -v -w -f stopwords somefile
总结

以上是内存溢出为你收集整理的linux – 使用grep过滤掉一个停用词文件中的单词全部内容,希望文章能够帮你解决linux – 使用grep过滤掉一个停用词文件中的单词所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/1039784.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-24
下一篇 2022-05-24

发表评论

登录后才能评论

评论列表(0条)

保存