使用NLTK删除停用词

使用NLTK删除停用词,第1张

使用NLTK删除用词

建议您创建自己的从停用词列表中删除的 *** 作员词列表。集可以方便地减去,因此:

operators = set(('and', 'or', 'not'))stop = set(stopwords...) - operators

然后,您可以简单地测试一个单词是否是单词

in
notin
集合,而不必依赖于您的运算符是否在停用词列表中。然后,您可以稍后切换到另一个停用词列表或添加运算符。

if word.lower() not in stop:    # use word


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5631195.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-15
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存