NLP文本预处理的三大流程

NLP文本预处理的三大流程,第1张

NLP文本预处理的三大流程 文本预处理的流程

先去除文本中的无关元素

将文本行拆分为单词或字符词元

※※制作字典,给每个token加上indices


整个nlp其实就是把文本中的字词符号等看作是带有时序的变量,而文本预处理就是把这些变量做成可以进行训练的东西。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5721209.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-18
下一篇 2022-12-18

发表评论

登录后才能评论

评论列表(0条)

保存