即便有了TensorFlow或OpenAI等人工智能框架的支持,相比主流网页开发人员,人工智能仍然需要深层知识和理解。如果你已经建立了一个工作原型,你就可能是这个房间里最聪明的人。恭喜你,你成了高级俱乐部的成员。
在Kaggle上,你甚至可以通过解决现实世界的项目赚到可观的收益。总而言之,这工作不错,但光凭它是否足以让你创办一家企业?毕竟,你不可能改变市场机制。从商业角度来看,人工智能只是现有问题的另一种实施方式。客户并不关心采取怎样的实施方式,他们只关心结果。这意味着你不能仅仅通过人工智能来坐享其成。蜜月期结束后,你必须要创造价值。从长远来看,只有客户才最重要。
虽然你的客户可能并不关心人工智能,但风投对此很关心。新闻媒体也同样关注。很多行业都是如此。这种关注度上的差异可能会给创业公司制造一个危险的现实扭曲力场。但你不要被骗了:除非你创造了通用的多用途人工智能,否则就没有免费的午餐。即使你是风投的宠儿,你也必须为你的客户走到终点。因此,让我们也当一回驾驶员,看看我们如何为未来的场景做准备。
“主流人工智能列车”
人工智能似乎与其他大趋势不同,比如区块链、物联网、金融科技等。当然,它的未来是不可预测的。但几乎所有技术都是如此。不同之处在于,我们作为一个人的价值主张似乎正处于危险之中——不只是其他行业。我们作为决策者和创意者的价值正在被重新评估。这引起了人们的情感反应。我们不知道如何定位自己。
基础技术的数量非常有限,大部分都可以归类为“深度学习”,这构成了几乎所有应用的基础:卷积神经网络、长短时记忆网络、自动编码器、随机森林、梯度增强技术,以及少数其他应用。
人工智能还提供了许多其他的方法,但这些核心机制最近已经取得了压倒性的成功。大多数研究人员认为,人工智能技术的进步将来自于这些技术的改进(而不是那些与之有本质区别的方法)。出于以上原因,我们可以把这称为“主流人工智能研究”。
任何真实的世界解决方案都由这些核心算法和非人工智能外形组成,来准备和处理数据(例如数据准备、功能工程、环境建模)。人工智能这一部分的改进往往会让非人工智能的部分变得多余。这是人工智能的本质,也几乎是它的定义——让解决特定问题的方法过时。但是,这种非人工智能的部分通常是以人工智能为驱动的公司真正的盈利来源。这是他们的秘密武器。
人工智能的每一个改进,都使得这种竞争优势更有可能开源,而且每个人都可以使用。但也会带来灾难性的后果。就像弗雷德里克?耶利内克曾经说过的:“每次我解雇一位语言学家,语音识别器的性能就会提升。”
机器学习基本上已经引入了下一阶段的裁员:代码被简化为数据。几乎所有基于模型、概率和规则的识别技术都是在2010年被深度学习算法淘汰。
现在只要用几百行脚本(加上相当数量的数据)就能打败领域专业知识、功能建模以及成千上万行代码。正如上面所提到的:这意味着,在主流人工智能列车的轨道上,专有代码不再是一种可防御的资产。
重大贡献极其罕见。真正的突破或新进展,甚至是基本组成部分的新组合,这些只有非常有限的研究人员才有可能做到。正如你可能想到的那样,这个内部圈子的规模要小得多(开发者人数肯定少于100)。
这是为什么呢?也许这根植于它的核心算法:反向传播。几乎每一个神经网络都是通过这种方法训练的。最简单的反向传播形式可以在第一个学期的微积分课程中学到,完全不复杂(——但也不是小学水平的知识)。虽然这似乎很简单——或者可能是出于这个原因——在50多年丰富多彩的历史中,只有少数人能看到难点所在并质疑其主要架构。
如果反向传播能像今天这样具有可见性,我们的成就可能会比现在的阶段领先10年(计算能力除外)。
从70年代的普通神经网络到再循环网络,到今天的长短期记忆网络,都震动了人工智能领域。并且,它还只需要几十行代码!数代学生和研究人员经过数学计算,计算出了梯度下降法,证明了它的正确性。但最后,大多数人点了点头,说“这只是一种优化形式”便继续努力。分析理解是不够的。你需要某种形式的“发明家直觉”来使之与众不同。
要想拥有业界顶级研究水平绝非易事,因此99.9%的公司只是搭上主流人工智能列车,还无法成为业内大佬。核心技术是由业界主要的开源工具集和框架提供的。为了达到最新的水平,专有方法会随着时间的流逝而消失。从这个意义上说,绝大多数人工智能公司都是这些核心产品和技术的消费者。
列车通往何处?
人工智能(以及所需的数据)被拿来与许多东西进行比较:电、煤、黄金。这显示出科技界有多迫切想要找到规律或趋势。这是因为,这种知识对于规避一个简单的事实所能对你的业务或投资造成的风险至关重要。如果你把你的事业建立在人工智能列车的轨道上,没有什么能拯救你。
因为列车头已向商业领域飞奔而去,只有少数情况值得考虑。
第一种情况,主流人工智能研究列车的运行速度将明显放缓,甚至已经停止运行。这意味着更多的问题类别无法解决。这也意味着我们下车后,必须为我们的客户走到终点。这对创业公司来说是一个很大的机会,因为他们有机会开发专有技术,并有机会创建一个可持续发展的业务。
第二种情况是,主流列车在当前时期呼啸前行。那就更不容易躲开它的前进势头或下火车了。人工智能高速发展阶段中,个人方法的领域知识很可能被大公司“开源”。那么过去你所有的努力可能都变得一文不值。目前,像AlphaGo LINK这样的系统,除了由开源框架提供的标准(“vanilla”)功能外,还需要很高比例的专利技术。如果我们在不久的将来看到具有相同功能的基本脚本,我不会觉得惊讶。但“未知的未知”是一类问题,下一波人工智能的发展浪潮便能解决。自动编码和基于注意力的系统在解决这类问题上胜算很大。没有人能想象出,哪个垂直领域可以通过这个解决。 几率:可能。
第四种情况,火车的速度更快。最后,“奇点已近”。现在已经有关于这方面的书了。亿万富翁们一直在为之奋斗。我可能会再写一篇关于它的文章。这里的终极游戏是人工通用智能。如果我们做到了这一点,一切赌注都结束了。
最后,还有“黑天鹅”事件的情况(“黑天鹅”指非常难以预测,且不寻常的事件,通常会引起市场连锁负面反应甚至颠覆)。在车库里的某个人发现了远离了主流算法的新一代算法。如果这位独行侠可以自己使用这种算法,我们可能会看到第一个自制的亿万富翁。但这种情况又从何而来呢?我不相信这种事可能会突然发生。它可能是主流技术和被抛弃的基于模型的算法的结合。2010年神经网络的兴起,一些曾经大有希望的方法(象征方法等)便失去了部分研究基础。目前在人工智能领域的研究也复兴了其他相关研究领域。要找到一种“不受欢迎”且还未涌入大量研究人员的技术或算法已经变得越来越困难。然而,可能会有一个局外人找到或复活一种改变游戏规则的方法。
谁能赢?
让我们把所有这些都放在一起,最后问一个价值百万美元的问题。答案不仅取决于以上种种情况,最重要的是在于你是谁。在这个等式中,业务的起始位置是一个关键因素,因为它的资源和现有资产是他们部署策略的关键。
在人工智能联赛中,有几家财力雄厚、能够吸引关键人才的公司。由于这是一个相当烧钱的过程,所以你需要其他的收入来源。这就限制了选手们进入著名的谷歌、Facebook、微软和IBM俱乐部。除了现有条件之外,他们还建立了庞大的专有系统,以及开放源代码的堆栈,来到达新的问题类。过了一段时间之后,你就会把这些东西放进下一代的开源框架中,以建立一个活跃的社区。
这些玩家也有自己的平台,可以用来训练更好的算法。人工智能可能是一个巨大的市场,但它对于企业和企业在日常业务中的应用也对企业的成功至关重要。这些平台包括亚马逊、Facebook、Google Apps、Netflix,甚至Quora,他们都使用人工智能来捍卫和加强其核心业务模式。他们想办法更好地为自己的客户服务,但他们意识到要保持自己的核心业务与他们用人工智能处理的工作截然不同(至少是公开的)。
一些新兴平台已经为他们自己的工具集找到了采用这一策略的方法。这些公司发现了一个人工智能起初只是有可能实现,或者是可以使之获利的想法。一个例子是语法检查程序语法。
乍一看,你可以把它看作是一个很好的插件,现有的供应商可以轻松地自己构建这种语法检查程序语法。但事情远不止如此。他们在这里建立了两项资产:一个社区生成的数据集,以进一步提高质量,并以更可持续的方式,为广告合作伙伴提供一个非常个性化的市场。
然后是工具制造者。就像马克·吐温说的那样——让别人挖金子,站在一旁,把铲子卖给他们。这在过去也行得通,在这里也行得通。提供数据,举办比赛,人才交易,人类教育。这一设想的蓝图是找到每一个人工智能野心家都需要(或想要)的东西,然后明码标价。
Udemy教授AI课程,而Kaggle则发起了人工智能竞赛,帮助其他公司走出自己的小圈子,让数据科学家们打造自己的技能。这两家公司都不需要在人工智能领域建立核心竞争力。企业还需要大量的数据才能取得成功。他们中的大多数人使用的是监督学习,所以必须有人监督。
最后,还有一些公司在人工智能咨询领域找到了自己的定位。因为即使是在巨人的开源框架的肩膀上,仍然有很多工作要做。
像Element AI这样的公司能够将这些额外工作的一部分产品化,并将其转化为一项服务。事实上,最近的1.02亿美元投资确保了他们成功所需的雄厚财力。
还有其他一些公司正在蓄势待发,那些鼓吹自己有针对性的人工智能解决方案的公司,正在取代现有的商业流程。然而,这些公司在两个方面面临挑战。可以开发开源项目来解决同样的问题,而现有的供应商正在大量投资于更自动化的解决方案,以解决同样的问题。该行业最重要的因素是主流人工智能研究的速度,这种研究只在一小群研究人员中进行。他们的测试结果会在第一时间使用人工智能冠军玩家开发的框架开源。其余的人要么是想在人工智能领域分一杯羹,要么要阻碍其发展。最终,定位是一切,而决定了自己位置、并记住以上所说情况的公司,也能到达他们想要的目的地。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)