建议您创建自己的从停用词列表中删除的 *** 作员词列表。集可以方便地减去,因此:
operators = set(('and', 'or', 'not'))stop = set(stopwords...) - operators
然后,您可以简单地测试一个单词是否是单词
in或
notin集合,而不必依赖于您的运算符是否在停用词列表中。然后,您可以稍后切换到另一个停用词列表或添加运算符。
if word.lower() not in stop: # use word
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)