孩子们通过观察周围的环境,倾听周围的人,以及把所看到和听到的联系起来来学习语言。除此之外,这有助于孩子们建立语言的词序,比如主语和动词在句子中的位置。
在计算中,学习语言是语法和语义分析器的任务。这些系统被训练成由人类注释的句子,这些句子描述了单词背后的结构和意义。解析器在网络搜索、自然语言数据库查询以及Alexa和Siri等语音识别系统中越来越重要。不久,它们还可能用于家用机器人。
但是,对于不太常见的语言来说,收集注释数据既费时又困难。此外,人们对注释并不总是意见一致,而且注释本身可能不能准确反映人们自然的说话方式。
在本周的自然语言处理经验方法会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种通过观察来学习的解析器,它可以更紧密的模仿儿童的语言学习过程,这可以极大的扩展解析器的功能。为了了解语言的结构,解析器观察字幕视频,没有其他额外的信息,并将文字与记录的对象和动作联系起来。给定一个新句子,解析器就可以使用它所学到的关于语言结构的知识来准确预测句子的意思,而不需要视频。
这种“弱监督”的方法,意味着它需要有限的训练数据来模拟孩子们如何观察周围的世界和学习语言,而不需要任何人提供直接的背景。研究人员称,这种方法可以扩展数据类型,减少训练解析器所需的工作量。例如,一些直接注释的句子可以与许多字幕视频结合使用,这些视频更容易获得,以提高性能。
将来,该解析器可用于改善人类和个人机器人之间的自然交互。例如,配备了解析器的机器人可以不断观察周围环境,以加强对口头命令的理解,包括口语句子的语法或词句不够清晰。人们用部分的句子、即兴的想法和混杂的语言相互交谈。
解析器还可以帮助研究人员更好的理解幼儿如何学习语言。“一个孩子能以不同方式获得补充信息,包括听父母和兄弟姐妹谈论世界,以及触觉信息和视觉信息,来理解世界,”,处理所有这些同时进行的感官输入是一个令人惊奇的难题。这项工作是理解世界上这种学习是如何发生的更大的一部分。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)