哪三项技术带动了人工智能的发展

哪三项技术带动了人工智能的发展,第1张

人工智能技术发展到现在已经超过60年,它在历史上经历过三起三落的浪潮。第一个兴起阶段以1956年的达特茅斯学院会议为标志,首次提出了人工智能的概念;第二个兴起阶段以日本提出支持开发第五代计算机项目为标志,当时日本还研发出了许多机器人,到现在,日本的机器人技术在全球都处于领先地位;第三个快速发展阶段则以加拿大多伦多大学的教授欣顿(Geoffrey Hinton)于2006年提出深度学习神经网络为标志,当前正处于这个快速发展的阶段。

得益于数据、算法、算力这三驾马车,人工智能在2006年以后获得了巨大的发展。有一个有趣的说法,如果用火箭来比喻人工智能,那么数据是火箭的燃料,算法是火箭的引擎,算力即芯片是火箭的加速。我们从这个比喻中可以看到数据、算法、算力对这次人工智能浪潮的重要影响,下面我们分别简单分析一下这3个技术。

▲人工智能与数据、算法、算力的关系

第一驾马车:大数据成为人工智能持续发展的基石

随着互联网的飞速发展,这个世界上的数据变得异常丰富,数据量呈爆炸式地增长。据估算,从1986年到2007年这20年间,地球上每天可以通过既有信息通道交换的信息数量增长了约217倍,这些信息的数字化程度,则从1986年的约20%增长到2007年的约99.9%。在数字化信息爆炸式增长的过程里,全球信息存储能力大约每3年翻一番,每个参与信息交换的节点都可以在短时间内接收并存储大量数据。从1986年到2007年这20年间,全球信息存储能力增加了约120倍,所存储信息的数字化程度也从1986年的约1%增长到2007年的约94%。1986年,即便用上我们所有的信息载体、存储手段,我们也只能存储全世界所交换信息的大约1%。而2007年,这个数字已经增长到大约16%。信息存储能力的增加为我们利用大数据提供了近乎无限的想象空间。

从应用角度来说,今天的大数据越来越多地呈现出以下一种或几种特性:

大数据取代了传统的抽样调查。例如,以前电视台某个节目的收视率往往要由专业的调查公司通过抽样调查的方式估算出来。现在,有了微博、视频网站等,我们就可以直接利用网络上每时每刻产生的大数据对节目热度进行分析,其准确性往往超过传统的抽样调查方式。

许多大数据都可以实时获取。例如,每年“双11”期间的各类电子商务平台上,每时每刻都有成千上万笔交易进行着,所有这些交易数据都可以被实时汇总,供人们对“双11”当天的交易情况进行监控、管理、分析、汇总。大数据的实时性为大数据的应用提供了更多的选择,为大数据更快产生应用价值提供了基础。

大数据往往混合了来自多个数据源的多维度信息。假如利用用户ID,将用户在微博上的社交行为和用户在电子商务平台的购买行为关联起来,就可以向微博用户更准确地推荐他最喜欢的商品。聚合更多数据源,增加数据维度,这是提高大数据价值的好办法。

多来源、实时、大量、多类型的数据可以从不同的角度进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础。

第二驾马车:机器学习算法

机器学习是对能通过数据或经验自动改进的计算机算法的研究。对于机器学习的理解,我们可以从3个问题入手,即“学什么、怎么学、做什么”。首先,“学什么”即机器学习的内容,是能够表征此项任务的函数。其次,“怎么学”即机器学习的方法。要实现学习目标,就要教给机器一套评判的方法。从数学角度来看,就是为机器定义一个合适的损失函数,能够合理量化真实结果和训练结果的误差,并将之反馈给机器继续作迭代训练。最后,“做什么”即机器学习的具体执行,主要做3件事,即分类(ClassificaTIon)、回归(Regression)和聚类(Clustering),其中分类和回归属于监督学习的范畴,而聚类则属于非监督学习的范畴。目前绝大多数人工智能落地应用的背后,都是将现实问题抽象成相应的数学模型,都可以分解为这些基本任务的有机组合。

机器学习的分类

机器学习算法的广义分类大概有3种:监督学习、无监督学习、强化学习。

监督学习是指在训练的时候就知道正确结果。比如教小孩子分类,先给他一个苹果,然后告诉他这是苹果。经过反复地训练学习,再给他苹果的时候,问他这是什么,他应该告诉你,这是苹果。如果给他一个梨,他应该告诉你,这不是苹果。训练集的目标是由人标注(标量)的。在监督学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如防垃圾邮件系统中的“垃圾邮件”“非垃圾邮件”,手写数字识别中的“1”“2”“3”等。在建立预测模型时,监督学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断调整预测模型,直到模型的预测结果达到一个预期的准确率。监督学习分为两类:回归(Regression)和分类(ClassificaTIon),如果机器学习算法的输出值是连续值,则属于回归问题;如果是离散值,则属于分类问题。

和监督学习不同,无监督学习在训练的时候并不知道正确结果。继续上面的例子,给小孩子一堆水果,比如有苹果、橘子、梨这3种,小孩子一开始不知道这些水果是什么,让小孩子对这堆水果进行分类。等小孩子分类完后,给他一个苹果,他应该将这个苹果放到刚刚分好的苹果堆中去。无监督学习常用的方法是聚类(Clustering)。

强化学习是在机器学习算法程序运行的过程中,我们对它的行为做出评价,评价有正面和负面两种,目的是让它做出更有可能得到正面评价的行为。谷歌的AlphaGo围棋程序,赢了围棋界排名世界第一的柯洁,背后使用的就是强化学习技术。

深度学习算法引导机器智能水平的提升

深度学习是机器学习的子领域,具体来说,深度学习是机器学习中具有深层结构的神经网络算法。人工智能算法从专家系统到特征工程,最后到深度学习的这个过程中,人工参与在逐渐减少,而机器工作在逐渐增加,由于深度学习算法的优异表现得到了主流认可,所以在多方应用中得到长足发展,下面我们简单分析一下深度学习算法的优势。

深度学习算法优势浅析

深度学习在机器学习算法中独树一帜并取得长足发展的原因主要有3点。

第一,深度学习算法降低了对算力的需求。传统机器学习算法在语音识别、物体识别方面无法有效展开应用,其重要原因之一是无法使用语音及图像的高维度数据(high-dimensional data)在高维空间学习复杂的函数,这个问题被称为维度诅咒(Curse of Dimensionality),高维度数据的参数设置需求随着变量的增加呈指数增长,对计算能力提出了极大挑战,几乎无法完成。而深度学习采用多层调参、层层收敛的方式,将参数数量始终控制在一个较为合理的水平,使得原本不可计算的模型变得可计算了,其理解可如下图所示。

第二,深度神经网络具有完备性。从理论上来说,深度神经网络可以表征任何函数,因此深度神经网络可以通过不同的参数及网络结构对任意函数进行拟合,排除了其无法学习复杂函数的可能性。

第三,深度学习的特征选取完备。深度学习具有自动学习特征的能力,这也是深度学习又叫无监督特征学习(unsupervised feature learning)的原因。从深度学习模型中选择某一神经层的特征后,就可以用来进行最终目标模型的训练,而不需要人为参与特征选取。

第三驾马车:算力是人工智能技术实现的保障

人工智能领域是一个数据密集、计算密集的领域,传统的数据处理技术难以满足高强度、大数据的处理需求。人工智能芯片的出现让大规模的数据效率大大提升,加速了深层神经网络的训练迭代速度,极大地促进了人工智能行业的发展。在人工智能市场高速发展的今天,人们都在寻找能让深度学习算法更快速、更低能耗执行的芯片。

人工智能芯片主要包括GPU(Graphics Processing Unit,图形处理器)、FPGA(Field Programmable Gate Array,现场可编程逻辑门阵列)、ASICApplicaTIon Specific Integrated Circuit,专用集成电路)以及类脑芯片。在人工智能时代,它们各自发挥优势,呈现出百花齐放的状态。

GPU最初作为应对图像处理需求而出现的芯片。其特点为擅长大规模并行运算,可以平行处理大量信息。在人工智能技术发展早期,因其具有优异的大规模数据处理能力而被使用在多个项目之中。谷歌的图像识别项目、 AlphaGo项目、特斯拉/沃尔沃等诸多汽车厂商的辅助驾驶系统和无人驾驶实验中,均使用了GPU作为加速芯片。然而,从芯片底层架构来讲,由于GPU并非专为深度学习设计的专业芯片,并非是人工智能加速硬件的最终答案。

FPGA是一种通用型的芯片,设计更接近于硬件底层的架构,其最大特点是可编程。基于可编程的特点,用户可以通过烧入FPGA 配置文件来实现应用场景的高度定制,进而实现高性能、低功耗的目的。FPGA 成本较高,更适用于企业用户,尤其是可重配置需求较高的军事和工业电子领域。

ASIC是对应特定应用场景,针对特定用户需求的专用芯片。假如把FPGA比作科研研发专用芯片,那ASIC就是确定应用市场后,大量生产的专用芯片。全定制设计的ASIC芯片,针对专门的应用场景,性能和能耗都要优于市场上的现有芯片,包括FPGA和GPU。

类脑芯片架构是模拟人脑的新型芯片编程架构,这种芯片的功能类似于大脑的神经突触,处理器类似于神经元,而其通信系统类似于神经纤维,允许开发者为类人脑芯片设计应用程序。通过这种神经元网络系统,计算机可以感知、记忆和处理大量不同的情况。

总而言之,人工智能是一项复杂的前沿、新兴技术,在经历了多次起起伏伏的浪潮之后,这一次人工智能浪潮的产生涉及大数据、深度学习、人工智能芯片、计算机视觉处理、自然语言理解、语音识别、语音合成等多项技术。这些技术不断作用,互相融合,推动技术向前发展,为人类提供更美好的生活。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/2685849.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-15
下一篇 2022-08-15

发表评论

登录后才能评论

评论列表(0条)

保存