您的训练数据不正确。
您应该将所有实体放在句子中的上下文中:
At an altitude of <START:distance> 8000m <END> the temperature of boiling water is less than <START:temperature> 100ºC <END> .The climber <START:name> Renato <END> is carrying <START:weight> 50kg <END> of equipment.
如果您的训练数据来自真实世界的句子,并且具有与您要分类的句子相同的样式,那么您将获得更好的结果。例如,如果您要处理新闻,则应该使用报纸语料库进行培训。
此外,您将需要成千上万的句子来建立模型!也许您可以从一百开始,然后使用较差的模型来改进语料库并再次训练模型。
当然,您应该对句子的所有标记进行分类,否则将没有上下文来确定实体的类型。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)