看国内外语音交互厂商如何定位人工智能

看国内外语音交互厂商如何定位人工智能,第1张

  今天要讨论的这个话题应该不少关注人工智能的朋友们都挺感兴趣的,作为人体感官的重要一部分,以及输出思想的主要渠道,它被冠以新一代的交互方式,它就是——语音交互。搜狗、四维图形、百度、出门问问、云知声给霸屏了(虽然没有AR VR刷的那么厉害,但是眼尖的我还是注意到了!)

  怎么大家突然扎推搞起了语音交互?而且做的都还是智能驾驶应用?看来这里面一定有什么!所以编者决定今天给大家详细讲讲——“语音交互”。

  一、语音交互是什么

  语音交互其实可以分成两块:语音识别和语义识别。所谓语音识别,就是把人说的语音转化成计算机可读的输入,比如微信中的语音转文字功能。而语义识别,则要求更高。它要求机器可以听懂你说的语音,比如你问Siri今天天气怎么样,它需要听懂你说的意思,并完成相应的回答。语音识别和语义识别二者合一,就构成了语音交互,它将是未来的新一代交互模式。

  二、语音交互公司

  搞清楚一个行业最好的方式就是去看这个行业里有哪些公司,所以小编先扒了扒他们都在做什么。

  1、国外语音交互的大佬们

  Nuance

  全球最大的语音技术公司,超1000项专利技术 ,一度雄霸天下。当然现在依然很牛啦。在中国,有9%的语音识别应用是采用Nuance的核心技术。它和电信、移动、联通、网通都有合作,cctv春晚的呼叫中心也应用此技术。简直不可撼动。。。

  微软

  提到微软在语音交互的布局,不得不说起微软两姐妹,小冰和小娜。小娜Cortana是微软发布的全球第一款个人智能助理。能够了解用户的喜好和习惯,帮助用户进行日程安排、问题回答等。小冰目前已发布第三代,听说读写技能都已解锁,从最初只能单纯的文字对话跨越至纯语音的互动聊天。

  谷歌

  Google一直致力于投资语音技术,此前收购多家语音识别技术公司及专利。2011年,收购语音通信技术公司 SayNow 和语音合成技术 PhoneTIc Arts。 2014年收购SR Tech Group的多项语音识别相关的专利,其中包括 “ 搜索引擎语音界面” 和 “ 修改、更新语音识别项目系统” 的专利。

  今年4月份Google还开放了自己的语音识别API,即Google 语音搜索和语音输入的支持技术。Google Cloud SPeech API包括了80多种语言,适用于各种实时语音识别与翻译应用。

  苹果

  苹果收购过Siri、Novauris、VocalIQ等语音技术公司,且请了不少牛B的人组建基于神经网络算法的语音识别团队。最近苹果正依靠语音助手Siri构建更大的生态系统,在最新HomeKit的合作伙伴名单中,除了国内厂商海尔,还有照明厂商飞利浦、科锐 (CREE),以及Marvell(美满电子)、Honeywell(霍尼韦尔)等全球顶级制造商。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/2677489.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-14
下一篇 2022-08-14

发表评论

登录后才能评论

评论列表(0条)

保存