随着人工智能行业的快速发展,未来机器人都将在各行各业发挥重要的作用,且充满无限可能。在电影《超能陆战队》中,机器人主角“大白”既能识别他人跟它说的话,又能“机智”地给出回答。当语音识别和人工智能两项技术完善到一定程度,从冰冷的机器身上获得人与人交往的温度将成为可能。而智能语音作为最天然的交互入口,俨然已成为机器人领域的场景标配,尤其是服务型机器人领域。
专注智能硬件语音交互的思必驰于2007年在英国剑桥的高新区创立,早期曾提供语音口语教育服务。当2014年智能硬件风潮兴起,他们看到人机对话真正的落地的终端机会,于是思必驰将教育事业部剥离出去成立了驰声科技,开始全力深耕智能硬件领域的语音交互技术。其中,智能机器人领域也是思必驰所要垂直进攻的领域之一。
市场高需求意味着哪些高要求
当然市场的高需求,也意味着对智能语音的高要求。鉴于此,我们采访了思必驰机器人事业部商务总监王巍。她表示:“单纯强调识别率、唤醒率的语音技术已经不能满足市场需求。随着感知智能的发展,大量的数据资源的积累成为了下一步发展的基础,如何培养智能语音的认知智能,达到思考决策的目的,成为当前热点议题。”
思必驰机器人事业部商务总监 王巍
针对目前这种现状,思必驰语音技术更加专注于人性化的交互体验,在机器人领域,思必驰提供语音识别、语音合成、语音唤醒、多轮对话等纯软件技术方案,也提供如环形“6+1”远场麦克风阵列等软硬一体化的解决方案。
例如,360儿童机器人巴迪应用了思必驰的语音合成技术,浙江大华旗下的乐橙小乐机器人应用了环形“6+1”远场麦克风阵列,萝卜科技的小萝卜机器人一代应用了思必驰的单麦方案,二代机器人将应用环形“6+1”远场麦克风阵列。这些产品受到目标家庭的欢迎,均属于市场热销的家用服务型机器人。
出色的市场表现离不开思必驰软硬一体化的解决方案和一直对人机交互体验不懈的追求。
1、软硬一体化的解决方案
环形6+1远场麦克风阵列是软硬一体化的解决方案,主要针对机器人和智能家居中需求全角度拾音的硬件产品,其中6个麦克风呈360°排列,准确定位声源,误差控制在±10°以内;1个麦克风置于中间;自主研发降噪及回声消除技术,可实现回声消除(AEC)、声源定位(DOA)、波束成形(BF)、语音增强(SE)等功能;而且可实现业界领先的5米远场交互,5米92%,3米94%,1米96%。
环麦方案的应用意义重大,还表现在它相对单麦、双麦、线性麦克风阵列,它打破了原有麦克风拾音角度及交互距离的局限。一方面,实现全角度拾音,能更好的满足机器人及音箱类、中控类等需要全角度拾音的智能硬件的需求,进行精准生源定位;另一方面,麦克风阵列在前端充分利用其空域滤波特性,抑制拾音波束外的回声、混响等噪声,进行语音增强处理,辅之以语音识别引擎的二次处理,实现优质的远场识别交互。
机器人事业部商务总监王巍特别提到,风靡国际的大家已熟知的亚马逊Echo音箱,她表示:“这一市场典范级产品应用的也是环形麦克风阵列,与思必驰环麦6+1麦克风阵列方案有异曲同工之妙。”
2、交互始终是思必驰语音技术的重点之一。
与同行相比,思必驰是国内首先强调机器学习“认知智能”的语音企业,强调 “基于多轮对话的认知型对话系统”对智能硬件的核心作用。
思必驰认为,智能硬件中的人机口语交互的核心问题是:感知智能中的抗噪、远场识别和回声消除,以及强大的认知智能。从而增强语音方案的意图追踪及决策功能,为用户提供更人性化的交互方案。
如何应对语音交互体验存在的问题
机器人事业部商务总监王巍认为,尽管机器人市场的确十分火爆,同时智能语音作为交互方式的必备手段也备受期待,但是目前市场机器人交互体验存在两个非常明显的问题:一是交互刻板,无法判断用户意图,缺乏认知智能;二是后端资源欠缺,无法满足用户需求。
针对上述问题,思必驰是这样做的:
一方面,思必驰的语音解决方案更侧重于垂直场景下的语音交互,注重认知智能,追踪用户的真正说话意图,并反馈更精准有效的资源,增强交互。
另一方面,思必驰不断扩充后端资源,在社交、导航、音乐、天气查询、O2O、生活资讯、金融股票等各个领域扩充资源,满足用户更多需求。
坚持To B的商业模式,专注智能语音研发
这些年来,人机交互手段不断发生着变化,键盘、鼠标、触控到现在的语音交互,人工智能的不断发展必然会引起交互手段的不断变革,智能语音必然会成为每个领域场景交互的标配。
王巍认为,目前智能语音在车联网领域的应用较为领先与成熟,在物联网领域的应用紧随其后,整个智能硬件领域对智能语音的需求更为强烈。她表示:“未来智能语音技术,必将从当前的感知智能走向认知智能,进行自我思考,最终形成决策控制。”
思必驰目前针对智能车载、智能家居、智能机器人三个垂直领域提供智能语音交互方案。除提供语音识别、语音合成、语音识别++、语义理解、交互对话等核心软件技术之外,思必驰也提供整套的解决方案,如针对智能车载领域推出了AIOS对话 *** 作系统,针对机器人及智能家居领域的环形6+1远场麦克风阵列软硬一体化方案等。
未来思必驰将一直专注在智能语音的认知智能,让语音交互更加人性化。它也将会依托思必驰上海交大联合实验室,持续在智能语音的研发与应用领域发力,坚持To B的商业模式。据王巍透露,针对机器人领域,思必驰将在近期推出针对智能机器人领域的AIOS FOR ROBOT对话 *** 作系统,通过对上层领域制定的抽象接口,可极大缩短开发者的时间,提高开发者的效率,降低开发者后期维护成本。
思必驰也将依托稳健的研发技术,不断扩展在机器人领域的业务范围,我们拭目以待。
本次发烧友学院邀请了思必驰机器人事业部商务总监为我们分享目前服务机器人市场的生态环境,现状、市场需求、趋势、挑战点?以及在智能语音交互方面涉及到哪些相关技术,国内的发展现状?在智能语音交互和情感设计上目前有哪些技术难点?思必驰是如何解决这些难点?如何利用思必驰的6+1环形麦克风列阵解决方案快速打造一款机器人。发烧友学院直播教你如何提高机器人自然语言交互能力。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)