如何在OpenNLP中训练命名实体识别器标识符?

如何在OpenNLP中训练命名实体识别器标识符?,第1张

如何在OpenNLP中训练命名实体识别器标识符?

您的训练数据不正确。

您应该将所有实体放在句子中的上下文中:

At an altitude of <START:distance> 8000m <END> the temperature of boiling water is less than <START:temperature> 100ºC <END> .The climber <START:name> Renato <END> is carrying <START:weight> 50kg <END> of equipment.

如果您的训练数据来自真实世界的句子,并且具有与您要分类的句子相同的样式,那么您将获得更好的结果。例如,如果您要处理新闻,则应该使用报纸语料库进行培训。

此外,您将需要成千上万的句子来建立模型!也许您可以从一百开始,然后使用较差的模型来改进语料库并再次训练模型。

当然,您应该对句子的所有标记进行分类,否则将没有上下文来确定实体的类型。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5565370.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存