您可以在像这样处理文本之前编辑它们(请参阅此文章):
>>> import spacy>>> nlp = spacy.load("en")>>> nlp.vocab["the"].is_stop = False>>> nlp.vocab["definitelynotastopword"].is_stop = True>>> sentence = nlp("the word is definitelynotastopword")>>> sentence[0].is_stopFalse>>> sentence[3].is_stopTrue
注意:这似乎在<= v1.8时有效。对于较新的版本,请参阅其他答案。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)