AI 真的会带来下一场变革吗？如果是，那么机会在哪里？_技术

　　导读·人工智能（AI）到底是什么？

　　· 是否真的会带来下一场技术变革，将会带来什么机会？

　　· 深度神经网络是实现AI的终极方式吗？

　　带着这一系列问题，下面这篇文章进行了探讨，AI世代进行摘编整理，希望读者有所收获。

　　一、前言

　　· AI 到底是什么？为什么会被人们再次广泛的提及？

　　·AI 真的会带来下一场变革吗？如果是，那么机会在哪里？

　　·深度神经网络是实现 AI 的终极方式吗？

　　·AI 将会以什么样的形式出现？

　　·如何在这样一个国家、这样一家公司里深度的参与其中？

　　二、AI / AGI 是一种世界知识的组织形式

　　·技术壁垒创造商业价值

　　·从务虚到务实的转变

　　·AI 是下一代搜索引擎的核心

　　·机会 = 技术更迭/升级 & 场景创新

　　·关联是商业价值，在大数据中找关联，人工智能是手段

　　三、融合 + 开放会成为技术壁垒

　　·自定制

　　·整合需要实力和想象力

　　·探索与跟随

　　·开放的准则

　　四、打造护城河的第一步：自动化构建观

　　·集成交付流程与技术架构设计

　　·目前，只能将 AI 当成工具

　　·未来，最好不要让 AI 形成闭环

　　·检索与回忆

　　五、打造护城河的第二步：合理规划输入输出

　　六、打造护城河的第三步：重新思考平台门槛及黏性

　　·门槛、黏性与开放的能力

　　·打造 AI 平台

　　·pepper

　　七、打造护城河的第四步：万物互联与标准化传感器

　　八、打造护城河的第五步：协同设计与合作

　　·AI 提高人类的整体协作效率

　　·企业用户实现业务目标的主要障碍

　　·数据量大

　　·在共有大数据上协同工作

　　·连贯性计算模式

　　九、打造护城河的第六步：打造可视化服务

　　·可视化的重要性

　　·慎重设计视觉交互模式

　　十、小结

　　人工智能被再次热烈讨论的引爆点似乎是自动驾驶汽车，这是笔者的切身感受。各大主流汽车厂商相继给出各自相关产品投入使用的时间点，甚至很多对汽车行业不甚了解的互联网公司也积极参与其中。

　　自动驾驶以及高级辅助驾驶技术是多个科研方向的融合点，存在不止一条的技术路径。这一次，人们想通过深度学习的手段，让车具有人工智能。这种端到端的理想状态看似让问题变得简单，但是由于科学家尚且不能够完全掌握黑箱内部的具体情况，更无法得知黑箱与人脑到底有哪些异同，造成这件事情不可控。

　　此时，笔者感到问题重重。治学要严谨，落地更要有正确的方法论和产品观。但从根本上讲，也许对于 AI ，有几个问题需要重新思考：

　　AI 到底是什么？为什么会被人们再次广泛的提及？

　　AI 真的会带来下一场变革吗？如果是，那么机会在哪里？

　　深度神经网络是实现 AI 的终极方式吗？

　　AI 将会以什么样的形式出现？

　　如何在这样一个国家、这样一家公司里深度的参与其中？

　　观点

　　·AI / AGI 是一种世界知识的组织形式

　　技术壁垒创造商业价值

　　关于人工智能最著名的描述是——图灵测试：

　　一个人在不接触对方的情况下，通过一些特殊的方式和对方进行一系列的问答。如果在相当长的时间内，他无法根据这些问题判断对方是人还是计算机，那么就可以认为这个计算机是智能的。

　　人工智能可以应用到很多领域，比如 AI + 芯片、 AI + 共享经济、 AI + 光学投影、 AI + 知识型数据 + 语音技术 /+ 情感计算等等。

　　从务虚到务实的转变

　　比起上面那些抽象的概念，更重要的是如何有效的参与其中，创造真正的商业价值。比如，研发自动驾驶汽车这件事，笔者从起初关注怎么做，到思考为什么做，现在的想法却是，“我并不需要一个可以自己跑的车，我需要的是在此过程中，逐渐打造起自己的护城河，继而创造商业价值”。

　　笔者认为，在这个领域里，尽管切入的时间点有先有后，但并不存在永远的跟随者或者弯道超车这件事。在一个可以看见顶的市场里，做跟随者比做探索者轻松（比如通信解决方案行业的华为和爱立信）；但在一个未知领域，做跟随者的意义却不大，每个人、每家公司都应该有他自己的 AI 观，寻找那些快速开合的窗口，打造自己的核心壁垒是关键。

　　AI 是下一代搜索引擎的核心

　　提到搜索引擎就不得不提谷歌和百度。

　　百度的无人车其实早已上路，实现方式与人工智能相去甚远。但在去年十二月成立了自动驾驶事业部，今年九月更是成立了 L3 事业部，两者互为掎角之势，打算将 AI 全面的应用到自动驾驶汽车以及 ADAS 产品上。百度之所以投入如此巨大，也许是因为 AI 可以说是下一代搜索引擎的核心，后面会详细阐述这个观点。

　　百度无人车

　　机会 = 技术更迭/升级 & 场景创新

　　机会出现在两种情况下，一种是技术的自然更迭与升级，一种是使用场景的创新。比如 pc 互联网时代的搜索引擎，比如移动互联网时代的 smart phone 。

　　一次搜索算法的升级奠定了谷歌十几二十年的霸主地位；一次以触控为交互方式的场景创新与上下游整合让苹果攫取了smart phone 市场的绝大部分利润，更是给长三角等地区带来了众多产业红利。

　　关联是商业价值，在大数据中找关联，人工智能是手段

　　移动互联网加速了大数据时代的到来，模拟信号似乎一下子从人们的生活中消失，越来越多的活动使用数字方式表达。数据量剧增；速度、种类和不确定性也在增长；大部分的数据（比如图像、视频、自然语言和符号）都是非格式化的。

　　如果有一种计算模型可以处理和理解它们，在这些杂乱无章的数据中找到彼此之间的联系，企业/创业者就可以在这个计算模型的基础上，提高生产效率，提升企业运作模式，甚至做感知、预测、推理或者思考方面的场景创新；也许机会就来自这里。

　　直观上讲，可以拥有并且提供这种计算模型的公司要有一定的数据量以及一套设计完善的开放平台解决方案。下面，笔者将要就此进行详细论述。

　　数据量重要但不是瓶颈，瓶颈是融合/整合的能力。百度和阿里巴巴做了同样的一件事，百度的 ADAS 和自动驾驶汽车、阿里云车机单位时间内会产生几 T 的数据，包括语音、 *** 作等各方面的用户行为统计，此数据上报到云端，将会成为理解用户、训练网络最重要的数据渠道。

　　现在考虑这样一个问题：在人工智能领域，小公司相比大公司有哪些优劣点？笔者认为，就构建 AI 平台，制定标准规范而言，小公司没有任何优势，但是一旦平台搭建完毕，基于此平台的场景创新，小公司就有优势了，因为，就算公司分大小，但是创意并无大小之分。

　　这里，笔者是以数据量的大小来区分公司大小的。大公司拥有更多的用户数据，但是数据量越大，边际效益越减小。因此，创业公司只需要获取到够用的数据资源就可以了，至于数据规模的差异并不会带来实质性的差距，笔者正是基于此点认为数据量不是最关键的，关键是创意以及计算资源。

　　· 融合 + 开放会成为技术壁垒

　　自定制

　　假如有这样一种架构，企业/创业者可以自由选择他们的输入组合，比如传感器数据、图像、视频、自然语言等等，经过某个或某几个计算模型的处理，输出了标准格式的知识。企业/创业者因此无需再考虑如何理解未知信号的内在结构和联系，直接就可进入应用场景方面的创新。这种融合 + 开放的能力自然就会成为技术壁垒。

　　打造多源融合能力，重要且难。具体有多难，之前笔者在自动驾驶的文章中详细的介绍了一种多源传感器数据融合的方法，由此可见一斑。

　　整合需要实力和想象力

　　从更高的层次看，还有一个关键词是整合，整合需要想象力和实力：

　　苹果公司利用电容式触摸屏、LCD、Camera、陀螺仪等各类传感器，打造了一个以触摸为主要交互方式的使用场景。这些硬件没有一个是它自己生产的，但是它的工程师却可以深入的与各个硬件厂商沟通和指导。笔者第一次拿到 iPhone4 的时候，内心是震撼的，感觉它是个艺术品，颠覆了我以往对手机的认识，滑动起来如此的自然、舒服。（那时整个部门只有部门经理有一部，他非常大方的把手机留给我说，“你很有极客范儿，那么现在你帮我破解这个手机，把log抓出来，我要知道它为什么好”，然后连根数据线都没给我就转身走了。当然，现在这成了一个笑话）那时，我意识到，好的产品就是即使你使用同一家供应商，同样的硬件、模组，都达不到它的效果。这种整合实力，不但震撼用户，更让竞争对手连模仿都不知如何入手。这背后就是笔者提到的想象力和实力。

　　创造与模仿

　　在 AI 时代，无论是探索者还是追随者创造与模仿都将变得更加艰难，尤其是追随者：现在，尚且可以拆解竞品硬件、可以分析对手释出的软件接口、甚至可以使用高速摄像机反向推断算法，将来，面对的是一个黑盒，输入的是不知从何而来的数据，输出的是经过了上亿次非线性运算的数据，追随者将不得不彻底忘记逆向工程（我指的是一系列的技术/非技术的手段）。

　　开放的准则

　　笔者在设计 SDK/API 的工作中总结并坚守一个准则：对外提供的是 N 个1，要做到克制，控制好接口粒度，让用户自己创造 1+1 》 2 的效果。这很考验研发人员的设计能力和眼光，更可以彰显一个平台的开放能力。

　　融合与开放看似左右手互搏，实则互为表里。要成为这样的人：既有整合、融合的架构观，又有开放、克制的远见。

　　笔者认为：好产品 = 核心技术 + 集成交付解决方案，这两个方面会形成一道竞争对手无法轻易模仿、跨越的“护城河”。下面，笔者将要详细分析如何做到这两点。

　　· 打造护城河的第一步：自动化构建观

　　集成交付流程与技术架构设计

　　如何深度参与其中，实现个人价值？除了上面提到的架构观等方面，还应该有真诚沟通，发现需求的能力。这是笔者从早期工作中总结到的。当问出：“我能为你做些什么”的时候，总是可以发现真实的需求。集成交付流程与技术架构本就该基于真实需求合理设计。

　　举个例子，比如对外提供计算模块时，有些人把能想到的功能，统统实现并封装成接口提供给用户，至于用户如何在繁杂的技术文档中找到自己需要的功能以及后续的技术支持问题却并未考虑，甚至有些功能要靠用户在实际使用中慢慢体会，看似为用户做了一切，实则增添了不必要的麻烦。这就是我在上面说到的克制这个词的一种解释。

　　笔者是通过与客户沟通，找到需求点，重新设计交付流程及软件架构解决这个问题的。在与用户的沟通中，笔者发现：①客户需要高度定制的服务；②客户会因为交付软件包的大小舍弃现有方案转而选择竞品（早期，受限于智能机存储能力，软件大小是必须要考虑的问题。）。

　　于是，笔者将整体交付模式设计成：用户只需要在一个页面上做选择（一些用户会选择功能A、功能B，而另一些用户会选择功能B、功能C等等），当用户完成自定制后，自动构建工具会在后台抓取相应模块代码，动态封装软件包，交付给用户。如此交付的软件，不同需求的用户得到高度自定制的包。整个流程全自动化，无人为参与，保证了产品质量。

　　在我所设想的 AI 解决方案中，对外集成交付 AI 计算能力这一场景上，也有类似的设计：那时，自动构建工具抓取的就是相应的计算模型，创业者基于此就可以通过笔者上面提到的那个简洁的自定制界面接入不同的计算模型，这更具挑战！

　　笔者认为，在 AI 时代，高度自动化是应该被最先考虑的事情。以往要达到这个目的，要在设计第一个接口，写第一行代码的时候，充分的考虑各种冲突与耦合问题。在 AI 时代，这些问题或被放大或发生变化，甚至过去那些在系统研发中积累的经验变得不再奏效：如何处理计算模型间的融合？如何处理边界问题？这些都是工业界和学术界需要解决的问题。

　　目前，只能将 AI 当成工具；

　　未来，最好不要让 AI 形成闭环

　　近乡情怯，是一种很有意思的心理活动。随着人工智能被一次次的提起，随着技术手段的推陈出新，人工智能的轮廓似乎越来越清晰，笔者有时候在想，一旦有一天它突破了存储限制，学会了在网络间移动，那就太可怕了。正如概述中所说的，深度神经网络让这件事变得更加不可控。

　　如果人工智能是目的，如今深度学习就是手段，是一种上面提到的计算模型。这个实现手段其实尚未定型，甚至可以说，在 2017 年它会剧烈变化，这个变化趋势，在第二章会仔细探讨。

　　所以，笔者想要这样一种人工智能，它既是威力巨大的工具，又是知识的组织形式，它让看似无关的信号间自动关联，它颠覆了以往的数据存储形式，它是我在之前文章中提到的那个互联网大脑，2017 年这个大脑，不管它是深度神经网络还是树还是什么，都将迎来剧烈的变化。如果顺利的话，也许它会形成记忆，创造出新的知识，如果有一天它进化成世界知识的组织形式，它就是下一代搜索引擎的核心，AGI 便不是梦想。

　　检索与回忆

　　那么，再大胆假设下。联想大脑在处理不同任务时，总是不同的区域活跃这一特性。这种世界知识组织体系应该是由无数个小模型组成的，小模型内部通过权值共享等软件技术或者硬件技术高度连接，模型间弱连接，整体形成一个复杂的拓扑结构。此时，笔者上面所描述的自动构建工具就会进化成一个高性能的区块检索工具，一个搜索引擎。快速抓取计算模型，动态隔离、封装给用户。就好像是一个人在回忆自己已掌握的一项技能一样。

　　· 打造护城河的第二步：合理规划输入输出

　　一个系统的输入输出直接影响到它的易用性以及后续的可扩展性等重要属性，这个问题需要具体问题具体分析。

　　· 打造护城河的第三步：重新思考平台门槛及黏性

　　门槛、粘性与开放能力

　　笔者从 08 年开始从事软件研发，经历了几个平台，一个切身体验是，越是开发门槛低的平台，越能吸引更多的开发者，开发者多了，平台自然繁荣，这是一个互惠互利的模式。看似简单其实要做到它需要制定详细的技术路线，和一整套的解决方案。

　　比如，谷歌的 Android 平台。当年智能机兴起，笔者迅速从 Qt 转到 Android ，连编程语言都从 C++++ 切换到了Java，期间却并没有经历过多的痛苦，这个平台让 App 开发从少数人的游戏变成一群人的狂欢。如今 Android 已经渡过了它的快速成长期，笔者在离开这个平台的时候却有很多不舍，比如语言、工具用的熟；测试机容易获得；系统代码开源，这些年的共同成长，离开就是自废武功等等。如果不是经过仔细思考，认为 AI 时代， *** 作系统太重的话，真是无法轻易离开。

　　—— 这些都是在打造 AI 平台时值得思考和借鉴的问题。

　　Pepper

　　Pepper机器人

　　今年八月份，阿里巴巴联合软银富士康成立了一个机器人公司，同时阿里云也组建了自己的 NLP 团队。他们快速的将 yunos 移植到这个叫 Pepper 的机器人上。同时，将机器人的各种能力封装成 SDK 提供给开发者，各种能力间的处理对开发者透明，这也是一种融合 + 开放的形式。

　　这个 120cm 的机器人更容易走进日常生活，似乎会比自动驾驶更快的产生商业价值。

　　如果把这个机器人当作是阿里巴巴人工智能战略的一个组成部分，这个具有丰富传感器的硬件一旦拥有 OTA 的能力，便会自成一个 AI 生态环境，看似占尽先机。

　　但是笔者也有另外的看法：

　　首先，这种技术架构是不具备快速移植性的；

　　其次，在 AI 时代是轻 OS 的时代，OS 再也无法形成技术壁垒。

　　单一的硬件框定了应用范围，限制创新只是时间的问题。

　　基于大硬件平台或特定硬件平台对外提供 SDK，需要考虑开放安全合理效率调度体验连贯性一致性等众多问题，与重新开发 os 的难度相当。

　　阿里设想了一个机器人生态体系，并为此设计了一整套的解决方案，开发者都在此硬件上做创新。笔者认为，不应为了创造生态而主动造一个特定形式的生态，生态应该是自动形成，自行进化的。

　　笔者想要这样一种 AI 环境，创业者利用它开放的数据融合能力，广阔创新，看似没有生态环境，但却是真实的技术壁垒。这样带来了另外一个好处是，技术路径相当清晰，可以有自己的节奏。笔者认为，技术壁垒与技术路径是相当重要的。

　　· 打造护城河的第四步：万物互联与标准化传感器，打造感知型大脑

　　在设计 AI 平台解决方案的时候，应该时刻牢记 AI + ，因为 AI 无法自己形成一个行业，它需要各个行业的数据教育，一旦这个平台打造完毕，AI 也就进化为各个行业的技术壁垒，就看这个壁垒为这个行业创造多少增值了。

　　AI + 智能家居、金融和医疗这几个行业最接近日常生活，各类传感器的数据质量直接影响 AI 平台。提前规划各类传感器数据融合以及规范传感器数据标准还有通信标准是很有必要的。

　　感知型大脑是人工智能必将经历的阶段。数据融合后再抽象出更高的概念，这颗大脑也就具备了认知的能力，下一阶段就是认知型大脑。

　　打造护城河的第五步：协同设计与合作 & 打造可视化服务

　　人工智能可以提高人类的整体协作效率，增强人类认知能力：

　　“像铁路与无线通信技术一样，人工智能将会彻底的颠覆人们现有的行为习惯，提高人类的整体协作效率。目前还没有哪项科学技术可以像人工智能那样影响巨大，即便是号称可以上亿倍的提升计算速度的量子计算。因为，人工智能提升的是可触达能力，改变的是万物之间的连接方式，而这是无法简单量化的。”

　　企业部门之间在共有数据上协同工作的效率是影响业务目标的主要因素

　　数据量大

　　笔者在负责设计某产品用户行为数据分析系统的技术架构时，将客户端的可扩展性、鲁棒性及可靠性作为主要关注点。这套系统在产品早期，运行的非常高效精准，但是随着用户量以及上报数据种类增多，笔者发现后台人员要消耗相当的时间进行数据清洗工作。

　　早前，百度的无人车跑一天的数据，需要百度数据中心的几百台服务器一周的时间才能处理完毕。

　　这就是大数据时代将要面临的一项挑战。

　　在共有大数据上协同工作

　　更棘手的是，对于 AI 开放平台上的开发者和企业用户，他们的数据工作人员在工作时相互独立、使用不同的编程语言、没有共同的关注点，还要把时间浪费在数据收集与清洗上。所以如何在共有数据上高效协作，将会成为开发者/企业完成业务目标的主要障碍。

　　连贯性计算

　　作为一个技术人，协同设计曾经是笔者痴迷的一个方向。腾讯是一家非常开放的公司，它允许员工将工作带回家中完成，那么思考这样一种使用场景：

　　1.笔者不相信网络传输的安全性（尽管企业云盘等做的已经非常便捷） —— 网络隔离

　　2.也不想手动的将需要做的内容一个个的考入U盘 —— 物理隔离

　　3.甚至家中的电脑笔者都不想让它时刻联网 —— 安全保证

　　4.笔者想要一个安全高效的全自动化工具 —— 高自动化

　　5.可以在极短时间内为当前工作做快照 —— 高时间敏感度

　　这样即使家中电脑无网络连接，屏幕上也会显示正在做的工作，光标正停留在之前正在写的那行代码/文档/图形上，真正的无缝切换。最终笔者基于一切皆数据的思想，完成了这个软件的开发。这件事情发生在几年之前，那时笔者轻狂的认为个人理想主义与商业利益无法共存，最终这个软件只在自己和几个小伙伴间使用，它成倍的提升了时间利用率。当然，从赢得小伙伴的赞同中，笔者也实现了个人价值。

　　在 AI 平台设计上协同合作问题应该予以充分的考虑，凡是关系时间利用率的问题都不该忽视。

　　再发散思考下这个无缝切换问题。随着 AI 平台上的开发者变多，我们的计算能力就会覆盖相当比例的消费者，如果消费者从室内走到室外，从一个场景移动到另一个场景，这背后就有一个体验一致性问题 —— 不同的创业者引用了我们的不同计算模型，模型间应该有一种可以贯穿时间和空间的计算模式，使得消费者间，消费者与计算模型间，多个计算模型之间做到无缝切换，是否可以把这种计算模式称为：连贯性计算？或者浸入式计算？

　　提到连贯性计算与场景切换—— 分布式计算也就呼之欲出了，是否有一种新瓶装旧酒的感觉？

　　· 打造护城河的第六步：打造可视化服务

　　慎重设计视觉交互模式

　　人是一种视觉动物，期待万事万物的反馈。把 AI 当成工具，就该为它打造合理的反馈与容错机制。

　　感知因果五个感官之间相互影响，听到的看到的会影响触觉。感觉一个事件产生另一个事件的连续事件之间的最长的时间间隔是140ms。这个时间间隔是感知因果的最长时限。如果你的产品对用户的一个动作的反应时延超出了140ms那么用户就会从一种无意识的高效的状态中出来，转而思考这个反应是不是自己动作造成的。如果在搜索框使用过程中，用户敲打字符经过140多ms才显示出来，用户就会觉得这些字不是他输入的，他的注意力会从文字的意义转移到字符输入的这个动作上，从而导致速度下降，打字这个本来可以自动处理的动作变成了主动意识的处理，增加了用户出错的几率。

　　上面这段话摘自笔者攻关智能机产品触控体验问题的项目总结报告，笔者通过研究认知心理学中大脑常量等属性制定了：从优化LCD显示效果来提高触控体验这一技术路径，最终完成项目公关。核心思想是：攻关某个特定问题，如果最直接的路径会受限于当前技术能力，用取巧的方法也是可以的。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/dianzi/2440111.html

AI 真的会带来下一场变革吗？如果是，那么机会在哪里？

发表评论

评论列表（0条）