JAVA中使用哪个NLP工具包?

JAVA中使用哪个NLP工具包?,第1张

JAVA中使用哪个NLP工具包?

我建议您使用POS标记和字符串标记化的组合,以从每个摘要中提取所有名词。然后使用某种字典/哈希来计算这些名词的出现频率,然后输出N个最多产的名词..结合使用其他智能过滤机制应该可以很好地为您
提供POS标记摘要中的重要关键字,以查看POS标记器,网址为http://nlp.stanford.edu/software/index.shtml

但是,如果您期望您的语料库中有很多多词术语,而不是仅提取名词,您可以采用n = 2至4
的最多产的n-gram。



欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5104532.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-17
下一篇 2022-11-17

发表评论

登录后才能评论

评论列表(0条)

保存