我好像把所有事情都搞砸了

我好像把所有事情都搞砸了,第1张

Google又把事搞砸了

从CES(国际消费电子展)的进展来看,Google现在真的是把语音交互搞砸了,正在变成一个可以糊弄但不想成功的公司。谷歌不太可能在云计算平台上超越亚马逊。多年来一直在无人驾驶上修修补补,但似乎挂掉的概率很大,谷歌很可能在语音交互上再次输给亚马逊。

语音助手上大PK

2020年CES上最有意思的就是语音交互产品泛滥。从英伟达显卡到思维,各种大牌在这件事情上已经达成共识,都在争抢。这里的两个关键公司是亚马逊和谷歌。前一个是指产品是Echo和嵌入式语音助手Alexa,后一个是GoogleHome和嵌入式语音助手GoogleAssistant。

总的来说,无论从哪个层面来说,谷歌都有足够的优势、技术、资源和积累。然而,实际上可以看出,谷歌真的是落伍了,甚至可能无法挽留。

想要了解语音交互的市场情况,就必须对相关产品和技术的本质特征有深入的了解。

Echo的关键特征是两层技术纵横比(声学、语音识别技术、词义、检索和内容)的结合。其中声学是硬件和软件的分界点,向下涉及产品ID及其内部结构,向上危及语音识别技术。后半部分词义是纯手机软件和内容。

对于亚马逊、谷歌这样的公司,他们自然把自己定义为绿色生态和服务平台,所以关键不是硬件产品Echo本身,而是背后的语音助手,比如Alexa,因为只有Alexa才意味着新的绿色生态。

很多像Alexa这样的语音助手,感觉像是安卓这样的电脑 *** 作系统,其实更适合作为电脑 *** 作系统超级App。

实际上有两种方法可以将Alexa这样的语音助手安装到各种硬件中:

一种是纯软法。语音助手我也做的不错。谁想用就放进去。这种方法最多只能落到语音识别技术上,关键是词义和对话。这个方法最明显的借鉴就是百度搜索引擎。

一个是软硬结合。我会做一个模型硬件产品,然后对外开放硬件产品里的助手。这种方法最明显的借鉴就是安卓这样的电脑 *** 作系统。

纯互联网公司会倾向于第一种方法,因为这种方法最轻。那么,一个需要机构制造和营销的方法,也会落到声学的层面,无疑要重得多。

然而,模式一有两个关键问题:

语音交互在目前的服务平台(手机、平板电脑、电脑)上很难启动,但是把近场的语音交互马上转移到远场的实际效果会很差。谁来处理整个落地过程中的各种颠簸问题?

不知道硬件要求,如何设计一个兼容各种硬件的API,如何给硬件厂商展示一个更方便的方案?你是不是彻底把这种肮脏的生命力分给每一个硬件厂商自己摸索?

Google对外开放ASR和NLP的API已经很久了,但是从CES的结果来看,很明显Alexa等系统软件的集中式方案更受欢迎,既解决了与下一层硬件的兼容问题,也解决了后端开发内容的整合问题。

为了改善整个事情,我们可以谈谈做一个语音助手。事实上,有许多重要的基准:

做一个样板硬件产品,但不要习惯性的和现有客户对冲。马上新品类必须绕过手机和PAD,不然就被覆盖了。

丰富的后端开发内容。对于语音助手来说,硬件、歌曲甚至电话都是内容。内容一定要从头到尾慢慢填充长尾关键词内容。扩展就是把产品Alexa和Echo拆分,让后面的物品越多越好。

创造技术优势。在这里,技术既包括深度神经网络等纯优化算法,也包括声学等与物理密切相关的行业。当内容没有达到一定程度时,前端技术(声学和语音识别技术)比字义更关键。因为它们对速度和精度的危害更大。

美国亚马逊做对了什么?

在前面提到的许多点上,亚马逊美国基本上做对了一切。

第一,亚马逊没有逃脱硬件的困扰,花了四五年时间打造Echo,所以亚马逊把握住了一个很难被超越的主力位置。

看着很诡异,但客观事实会是那样的。否则,谷歌只会立即向外界开放谷歌助手,而不需要自己创建任何GoogleHome。但实际上,硬件与其背后的助手之间的耦合程度远远高于搜索与电脑浏览器之间的耦合程度。搜索和电脑浏览器的耦合程度其实是方便和不方便的,但是Alexa和前端开发的硬件的耦合程度就涉及到怎么用的问题了。谷歌是被迫这样做的。Echo工作压力刚开始做GoogleHome。

第二,在Echo基本成功后,美国亚马逊迅速开始剥离Echo和Alexa,实际姿态包括SDK(ask&AVS),创办Alexa基金,积极寻找发展战略合作伙伴。最终结果之一是7000个专业技能的简单英语。7000专业技能是很可怕的东西,完全够覆盖技术和一些内容短板。这就好比一旦淘宝店铺数量超过一定门槛,QQ总流量就大到无法理解。

现在,谷歌有多少第三方好友?它只有一个。而谷歌似乎还在徘徊。作为福分,本该上去把这一系列体现资源禀赋的项目干了,却没有。

第三是通过适当的规划创造更好的感觉。一个合适的方案是前端开发至少要和美国亚马逊差不多,后端开发要体现出词义和内容连接的优势,这样才能在整体上迎头赶上。但是Google有趣的选择了双麦克风方案,立刻造成交互效果不佳。这真的是很大的一招,从性价比的角度来说是有效的,但是你一直在做的是模型产品。性价比真的那么重要吗?

这代表什么?

这意味着谷歌很可能很难赶上亚马逊。

与亚马逊相比,毫无疑问谷歌在技术上是有优势的,但是如果把技术溶掉,你会发现其实谷歌很可能有优势,只是NLP和搜索的一部分。这是很可怕的,因为NLP的一部分不会有质的区别,仅仅靠优化算法是无法在这一点上明显打开你的感受的,在内容没有达到一定程度的情况下,检索的优势根本体现不出来。一旦技术完善,美国亚马逊在这里已经积累了足够的数据和信息。必须注意的是,这里的数据信息是与情况完全匹配的,而不是网页上发布的匹配度很低的数据信息,其中也包含了客户的各种喜好。

目前,没有人会扮演与谷歌陪练教练的角色,从头再来。

谷歌似乎又犯了一个错误。

在过去的很长一段时间里,谷歌这个企业有点神话,让人潜意识里觉得无人能敌。然而,谷歌真的不是一个制造产品的企业。你或许可以把它定义为做优化算法的企业,或者沉迷于优化算法的企业。如果说谷歌在语音交互方面确实发挥了很大的作用,关键原因大概就在这里。

技术在优化算法的情况下是第一关,但感觉在产品的情况下是第一关。不能倒打一耙:我是很有技术含量的,所以要放在产品里,所以客户要付费。只是反过来想,比如及时性、回复率、对话准确率等,对这类产品的客户体验都是有害的,所以目前我想在技术上把这种感觉做到完美。

从主要的个人行为来说,谷歌恰恰属于前者。

上面提到的选择两个麦克风来完成GoogleHome的计划,从这个角度来说也是成立的。比如你想在云端使用深度神经网络解决前端开发的数据信号问题,而且你确定能做好,那么选择前端开发方案完全没问题,后端开发可以不断完善优化算法。

但这样一来,产品感觉上的折扣就很厉害了。如果谷歌率先公布这类产品,而且周期时间很长,问题不大。重要的是它不是。它必须要有这样的产品才能和美国亚马逊的Echo市场竞争,太恐怖了。在你之后,就算保证同等水平,也没什么优势,更别说差不多了。挑战新技术的应用,在技术工程师的逻辑思维下是有效的,但在产品的逻辑思维下是吓人的。

也有很多难点,比如你的唤醒词叫什么?不是“OKGoogle”。做助理显然更适合这种拟人化的场景。

GoogleHome走出去之后,应该是下大力气向各个厂商推广GoogleAssistant,而不是在自己的优势上睡大觉(Google在技术上有优势,机器设备关系不同,内容也有优势。毕竟它有Youtube等。),但从CES来看,谷歌并不忙着做这个。至少到现在,人们还是看不到谷歌的Alexa服务包和Alexa语音服务。

看看美国的谷歌和亚马逊至少相差一年。对于做产品的客户来说,选择取决于哪一个甚至是一个需要考虑的难题。一方面有很多开放API的第三方客户,另一方面没有开放API的第三方客户只有一家。你也会选择那个!(把软硬件连接和API封装到这种程度还是很费力的。如果你不相信我,看看这里的文本文件。

摘要

谷歌的业务流程最依赖云,但在云服务器上实际上输给了美国亚马逊。谷歌一开始就开始了无人驾驶,不过好像会一大早起来赶一个晚集。谷歌的人工智能技术投入最大,但从目前的进度来看,很可能再次输给美国亚马逊。

如果说前两次不成功,不动摇,那么这一次就大不一样了。因为AI中的交互是搜索,实际上玩不起,输了就变成另一个微软公司。

创作者:李志勇

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/781323.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-04
下一篇 2022-05-04

发表评论

登录后才能评论

评论列表(0条)

保存