最近,语言学习软件Duolingo的AI研究负责人Burr Settles,对他们如何运用人工智能为用户制定个性化的学习课程进行了详细介绍,主要包括数据跟踪、统计模型、技能人才和沉浸式体验四个方面。Duolingo是一款跨平台应用,用户可以通过该平台游戏化和小规模的课程,学会阅读、倾听和说几十种语言,包括汉语、印地语和阿拉伯语,甚至像克林贡语这样的虚构方言。
目前,Duolingo在全球拥有3亿用户,并筹集了超过1亿美元的资金,市场估值约为7亿美元,其中知名支持者包括Alphabet的CapitalG和Kleiner Perkins。近日,外媒VentureBeat在伦敦举行的人工智能峰会上,对Burr Settles进行了采访。Settles表示,Duolingo人工智能战略的核心是尽可能接近人与人之间的体验。
如今,许多像Duolingo这样的公司已经利用智能手机的普及和无处不在的网络连接,为世界各地的用户们提供语言学习服务。据市场研究公司的数据显示,2018年全球在线语言学习市场的规模达到了90亿美元,2026年有可能超过200亿美元。在此背景下,Duolingo一直在投资人工智能和机器学习,做到像人类教师一样为每个人量身定制自动化课程。
Settles在美国卡耐基梅隆大学(Carnegie Mellon University)担任博士后研究科学家后,于2013年加入Duolingo,负责从前端到后端的所有工作。在加入Duolingo不久后,Settles和团队就开始寻找改变Duolingo学习模型构建模块的方法,这些模型基于70年代的闪存卡调度算法。Settles表示,这项工作的挑战之一,是那些利用人工智能进行实际教育的机构很少。但Duolingo拥有大量的学习数据,可以用来从头开发新的模型和算法。
Settles还表示,他接受这份工作的部分原因是数据量、数据类型和数据的唯一性。他和团队一直用启发式方法,收集关于学生们做语言练习和练习时长的数据,并尝试创建预测模型来跟踪这些统计数据。由于对用户数据统计和跟踪的需求,Duolingo一直在开发自己的统计和机器学习模型,并结合了像间隔重复的学习技术,以优化和提供个性化课程。
间隔重复的理论是,用户间隔重复短课比在短时间内填满相同的信息效果要更好。与此相关的是“滞后效应”,如果练习课之间的间隔次数逐渐增加,用户的学习效果将能进一步提高。但是,系统自动提供语言学习课程的主要问题是,用户现有的语言知识、个人情况和性情差异很大,机器学习模型往往是二元的,难以考虑到个体的细微差别。
这就是Duolingo“半衰期回归”统计模型的来源,该模型能分析数百万语言学习用户的错误模式,以预测个人长期记忆中每个单词的“半衰期”。在语言学习中,半衰期指人们脑中的词汇或语法知识。如果人们一天都没有练习新语言,那么它有50%的机会忘记这一课。因此,“半衰期回归”就是系统深入一个人的大脑,弄清楚人们知道什么或不知道什么,并针对性地制定课程。
Settles发现,当他们将“半衰期回归”统计模型投入使用时,用户的参与度提高了12%。另外,定位内容的方法很重要,例如,像人类教师一样考虑对学生受半衰期回归的影响。但内容本身也同样重要,因此Duolingoy也转向人工智能,帮助团队建立适合不同用户的内容课程。
对此,Settles表示:“英语中有数百万个单词,也许有10000个高频词,你教他们的顺序是什么?你怎么把它们串在一起?”于是他们建立了一套系统,以帮助内容创作者制定初级、中级和高级材料。还有一个挑战是,尽管Duolingo只有40%的用户在学习英语,但公司用来训练人工智能系统的大部分教学数据,都是为英语开发的。
因此,Duolingo需要将它的系统移植到其他语言上,称为迁移学习(Transfer Learning)。目前,尽管人才储备在缓慢增长,但AI技能人才依旧短缺,许多大型科技公司一直在努力收购有潜力的人工智能创企。人才短缺也是Duolingo在过去几年中遇到的挑战,尤其是它关注人才的特定技能组合。它的人工智能研究跨越了一系列学科,除了语言和语言学外,还涉及心理学和学习科学。
Settle表示,他们希望能拥有更多擅长语言、人工智能和认知科学三门学科的交叉型人才。他们的标准很高,在申请AI工作的人中,能一路过关斩将通过的不超过0.5%。在过去18个月左右的时间里,Duolingo发现合格人才的兴趣略有增长,其中包括来自其他科技公司和学术界的申请人。对此,Settle表示,有相当多人来自较大的科技公司,他们也直接从博士项目中招聘了很多新人,主要原因是他们的思想较为开放,并且还没有被制度化。
远程教授语言最大的挑战之一是,很难创造出一种吸引人且充满沉浸感的学习体验,让学生保持学习。为了提高参与度,Duolingo在2016年推出了一款聊天机器人,能通过应用程序中的文本和学生自动对话,帮助教授语言。不同机器人的角色能够对一系列不确定的答案做出各种反应,如果用户卡住了,可以点击“帮我回复”按钮。目前,Duolingo的机器人似乎暂时被官方删除,但这种自动化的学习取代了人类教师,将虚拟教学提升到了一个新的水平。
如果将虚拟现实(VR)融入教学中,用户可以带上耳机进入虚拟教室,学习一门新语言就会变得更有吸引力。针对Duolingo将来是否会使用VR沉浸式教学的这一问题,Settle表示这是有可能的,公司似乎很清楚这些新兴技术将带来的好处,并且沉浸式教学的潜力也许是巨大的。目前,Duolingo没有透露任何关于智能语音助手集成或沉浸式视觉教学的计划,但它将进一步让语言学习内容和交付更具个性化,努力将人的元素融入自动化学习。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)