人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。[1]
导读新年伊始,在2020年受疫情影响的大环境下,物联网也迎来了更多充满戏剧性的挑战与变革,在疫情爆发后,各地采取的一系列措施及发生的这大大小小的的事件背后,多多少少都有物联网的身影,为此,在这里小编整理了相关报告后,和大家说说2020年物联网在全球的主要进展,分享给大家以供参考和借鉴!下面我们一起来看看物联网2020年回顾:十大重要进展。
Part I: Covid-19对IoT 2020的影响
受疫情影响,公众对物联网的兴趣下降了15%
人们通过Google搜索“物联网”话题的频率在2020年骤然下降。自2020年3月疫情大流行以来,这一下降比例达到15%;此后,“物联网”话题搜索量一直保持相对稳定并处于较低水平,也没有回升迹象。物联网显然不像其它话题那样在公众中扮演重要角色,例如:在同一时间范围内,公众对游戏的搜索兴趣猛增了约65%、对“在家工作”的兴趣增加了104%、对“失业救济金”的兴趣猛增了250%。在对3000多个财报电话的分析显示,在2020年第二季度,“IoT”一词的使用量呈类似下降趋势。但是,有关物联网,尤其是“工业物联网”的讨论在第三季度又重新开始。
尽管疫情大流行,但2020 IoT市场仍然强劲
尽管Covid-19疫情不断,并且
2020年全球GDP下降了5%,物联网市场在2020年仍在增长(无论是支出规模还是连接设备总数)。虽然有少量物联网项目因各种原因(如在封锁期间无法建立基础设施)而停止或推迟,但大多数物联网项目在2020仍在继续。
事实上,2020年是智能设备的一个拐点——活跃的物联网连接数量(例如:连接的汽车、智能家居设备、连接的工业设备)等,有史以来第一次超过了非物联网连接的数量(例如:智能手机、笔记本电脑和台式机)。目前全球有217亿活跃的连接设备,其中54%(117亿)是物联网设备连接。到2025年,预计将有超过300亿个物联网连接,即地球上几乎每人有4个物联网设备。
十余个物联网主题随疫情加速发展
物联网在应对疫情中起着至关重要的作用。一些以物联网为中心的用例在帮助世界应对疫情方面发挥了(并将继续发挥)重要作用。最值得注意的包括工作场所、医院和其它基于物联网的接触者追踪(例如:Concept
Reply的跟踪和定位系统),以及整个疫苗供应链中的产品跟踪和验证(例如:Controlant)。
对2021年的前景持谨慎乐观态度
进入2021年,物联网技术的整体情况,看起来很乐观。人们普遍认为,任何因Covid-19对业务的负面影响都将在2021年逐渐消失,新的“数字化转型浪潮”将推动物联网市场的发展。企业将加速发展的主题之一是“新技术支持的商业模式”,其中许多新的商业模式将由互联的物联网产品来实现。企业关注的另一个主要主题是“人工智能”。
Part II: IoT 2020十大进展
最大的物联网新势力:小米
2020年1月,来自中国的电子制造商小米宣布计划在未来5年内至少投资72亿美元用于5G和人工智能(AIoT)。新的推动包括对智能电视、无人机、电动滑板车、空气净化器、路由器、安全摄像头等一系列消费和企业物联网设备的重大投资。
物联网在对抗Covid-19中的最大贡献:挽救生命
在2020年初,物联网行业没有人能够预见到,IoT技术将在这一整年中为拯救生命而扮演重要角色。伦敦帝国理工学院于2020年6月进行的一项被广泛引用的研究估计,在第一波Covid-19大流行期间,社交距离仅在欧洲就挽救了300万条生命。虽然这些被挽救的生命大多可以归功于人们只是待在家里、戴上口罩和避免接触,但物联网技术无疑在一些情况下阻止了进一步的传播。
许多物联网厂商竞相推出社交距离工具(包括BoschIO的工作场所隔离和联系人追踪解决方案,Software AG和Dell的Smart Social
Distancing解决方案,或Concept Reply的追踪和定位系统等)。
位于德国莱比锡的Goebecke面包店只是使用这种解决方案的众多企业之一。该企业老板介绍,工作场所的音频提醒和对员工数据的分析能力,都使员工更加谨慎、意识更强,这些员工随后变换了各自之间的距离。
最近,用于Covid-19的物联网的重点已经转移到疫苗供应链监控上,以确保疫苗安全交付,不发生产品丢失、篡改或变质。例如,辉瑞公司(Pfizer/Biontech)选择了冰岛的初创公司Controlant来监控其Covid-19疫苗的配送。
加速最快的物联网垂直领域:医疗保健
多年来,由于行业的高度规范性以及缺乏对医疗数字化的支持和紧迫性,在医疗环境中实施物联网项目被证明是很麻烦的。
现在,越来越多的证据表明,Covid-19已经导致了医疗保健领域的数字化爆炸,特别是在医院。美国食品药品监督管理局(FDA)在2020年5月发布了多项临时政策,以在2020年支持数字化工具。德国在2020年10月首次允许医生开出针对特定疾病的数字健康应用(例如,一款有助于治愈焦虑症的应用)。
在大流行期间激增的应用之一是“远程医疗”,即医生通过视频会议治疗患者。医生报告说,远程医疗通常被视为只是迈向数字诊断的第一步,它依靠物联网设备从远处诊断病人。数家医院于2020年开始进行试验。2020年12月,一名伦敦外科医生在加利福尼亚用5G技术对香蕉进行远程手术的视频在网上疯传。
2020年最大的物联网融资:Samsara
Samsara又成功了。2020年5月,在第一次Covid-19大封锁期间,该公司又筹集了4亿美元,旨在进一步扩大其工业物联网业务。本轮融资对该公司的估值为54亿美元,较2019年投资时估值下降14%。首席执行官Sanjit
Biswas在宣布这轮融资时,还宣布裁员300人(占劳动力的18%),这是由于Covid-19对关键垂直运输系统的影响。
2020年值得注意的顶级投资(与物联网相关)包括:
最重要的技术标准化:5G Release 16
2020年7月,3GPP标准机构达到了一个重要的里程碑:发布版本16,这是5G技术的第二套规范,也是5G
IoT的关键一步。构成版本16的一套新规范包括对“超可靠、低延迟通信”(eURLLC)、定位功能以及对TSN(时间敏感网络)的支持等方面的重大改进,所有这些方面对于各种物联网用例的物联网连接都非常重要,尤其是对于高端应用,如工业物联网领域的应用。此外,版本16还可以在新的5G核心网上部署和管理NB-IoT和LTE-M技术,使5G网络可以通过这些技术管理大规模和低复杂性的物联网。当前,全球约有2亿个IoT连接使用NB-IoT
/ LTE-M的产品。预计,面向高端应用的5G物联网将在2022年及以后兴起。
最著名的新流行语:AIoT
多年来,人们一直认为,物联网的真正价值可以通过应用于物联网数据流的AI/ML算法来解锁。因此,事后看来,“AI + IoT=
AIoT”在2020年出现并成为一个新流行语也就不足为奇了。在2020年12月,Google对这个话题的搜索量大概比12个月前多了70%。有趣的是,这个词似乎起源于中国(而不是像“
IoT”一词起源于美国)。华为和小米以及台积电(TSMC)这几年一直在推崇人工智能物联网的概念,即人工智能和物联网的融合。
2020年,许多“非中国”公司在品牌推广工作中都使用了这个术语。美国工业软件提供商Aspen Technology于2020年8月宣布了其新的工业40
AIoT
Hub,瑞士网络安全公司Wisekey于2020年9月推出了以AIoT为中心的新数字战略。在2020年推崇这一术语的公司的其它例子包括总部位于新加坡的ASM
Pacific Technology和总部位于美国的分析软件提供商SAS。
最大的物联网相关收购:Nvidia-ARM
2020年9月13日,英伟达宣布有意收购ARM,这是迄今为止最大的半导体交易,估值400亿美元。除了是最大的半导体交易外,此次收购有望为AI&边缘物联网带来新的技术创新。英伟达收购的主要业务板块是ARM的处理器IP,其中也有重要的IoT成分,尤其是边缘计算。ARM的IoT产品&服务集团(ARM的Pelion
IoT平台、MbedOS、SoC解决方案/安全、KigenSIM解决方案)将不参与此次交易。如果这笔交易获得监管部门的批准,可能会出现这样一种情况:中国企业永远得不到ARM的技术。这可能会进一步造成美中贸易关系的不平衡,从而使美国在半导体知识产权市场占据主导地位。
2020年的重要收购(与物联网相关)包括:
最雄心勃勃的新物联网连接技术:Amazon Sidewalk
2020年11月,亚马逊通知Amazon Echo设备和Ring安全摄像头的客户,Amazon
Sidewalk将很快推送到他们的设备上。Sidewalk是一个雄心勃勃的项目,旨在创建一个邻里共享的网络,让宠物或资产追踪器等物联网设备,即使在家庭Wi-Fi网络中断或超出范围时也能连接到互联网。这是通过将不同的Wi-Fi网络连接成一个低带宽网络,供不同用户的物联网设备使用的技术。
2020年9月,LoRa低功耗标准幕后的芯片公司Semtech宣布已与亚马逊建立合作伙伴关系,以合作构建网络;几个月后的12月,据报道LoRa联盟正在洽谈,也将加入并支持Sidewalk,使用开放的LoRaWAN标准,该联盟及其500多家成员公司都支持该标准。
最重要的政府举措:美国物联网网络安全改进法
2020年12月,《物联网网络安全改进法案》终于签署成为美国法律。其中,该法律要求美国国家标准与技术研究所(NIST)定期(至少每5年一次)更新物联网安全标准和指南。专家们希望,该法律能够促使制造商在设计物联网设备时考虑到一些网络安全功能(例如:使用安全编码实践、提供足够的认证、定期给设备打补丁)。
最大的IoT 2020 IPO:C3ai
2020年12月9日,C3ai上市(在纽约证券交易所交易,股票代码为“AI”)。C3是一个真正的物联网成功案例。该公司由美国亿万富翁Tom
Siebel于2009年创立,他因创立Siebel Systems公司而闻名,2006年1月该公司出售给甲骨文。C3ai最初叫C3
Energy,主要专注于电网、电表和公用事业的数字化,该公司后来(2016年)品牌更新为C3IoT,并将其关注点扩大到能源之外,作为一个横向物联网平台。近年来,该公司强调通用分析和人工智能能力,这也是为什么该公司再次将品牌重塑为C3ai。今天的C3ai声称它可以从5700万个传感器读取数据,但Siebel明确表示,重点是AI(包括非IoT应用)。2020年12月上市至今,股价已较开盘价飙升超过40%,估值近140亿美元(截至2021年1月8日)。
以上就是小编今天给大家整理分享关于“年度盘点|物联网2020年回顾:十大重要进展”的相关内容希望对大家有所帮助。小编认为要想在大数据行业有所建树,需要考取部分含金量高的数据分析师证书,这样更有核心竞争力与竞争资本。
云计算、大数据、人工智能这三者的发展不能分开来讲,三者是有着紧密联系的,互相联系,互相依托的,脱离了谁都不能更好的发展,让我们具体来看一下!一、大数据
大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
数据每天都在产生,各行各业都有,数据量也是相当之大,但如何整合数据,清洗数据,然后实现数据价值,这才是当今大数据行业的研究重点。大数据最后要实现的是数据超融合,应用到应用场景,大数据的价值才会体现出来。
人工智能就是大数据应用的体现。
二、云计算
云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。
对云计算的定义有多种说法。对于到底什么是云计算,至少可以找到100种解释。现阶段广为接受的是美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
说白了,云计算计算的是什么?云存储存储的是什么?还是大数据!所以离开大数据谈云计算,离开云计算谈大数据,这都是不科学的。
三、人工智能
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种复杂工作的理解是不同的。
人工智能其实就是大数据、云计算的应用场景。
现在已经比较火热的VR,沉浸式体验,就是依赖与大数据与云计算,让用户能够由更加真切的体验,并且VR技术是可以使用到各行各业的。
人工智能不同于传统的机器人,传统机器人只是代替人类做一些已经输入好的指令工作,而人工智能则包含了机器学习,从被动到主动,从模式化实行指令,到自主判断根据情况实行不同的指令,这就是区别。
大数据的概念在前几年已经炒得火热,但是也就是近两年才开始慢慢落地,依赖于云计算的发展,以及人们对人工智能的预期。
某一天清晨起床,突然发现把手机落在别处了。没有手机,整整一天失魂落魄的,感觉做什么都不方便,和外界几乎断了联系。
直到拿到手机,那一刻,心终于安了下来。
不知道大家有没有这样的经历和感觉,手机似乎一刻也不能离手。
我在想, 人工智能已经来到我们身边并深深影响着我们。
面对未来,估计会越来越“厉害”,那么,我们,我们的孩子,究竟要如何准备,去迎接这个世界呢?
我不是引导焦虑,这不仅是为人父母要考虑的事情,也值得职场人士深深地思考。
我们是给孩子一个旱涝保收的金饭碗,或者干脆让孩子学习编程和人工智能技术,还是给孩子留下足够的财富?或者
01
人工智能的冲击
我们来看看人工智能,依据本人非专业的理解,其核心能力基础在于三点:
一、 海量数据: 超多的数据,随时调用不用“伤脑经”。
二、 深度学习: 有了大量数据,有了因果数学关系,人工神经网络就可以进行深度学习,依此做出判断和识别。
三、 超强算法: 我们现在都知道大数据杀熟等新鲜事物,机器人拥有超强计算力,可以对海量的数据进行分析、归纳和整理,算法赋予了它快速思考解决问题的能力。
拥有这三项高超的能力,再加上人工智能不需要吃喝拉撒睡来补充能量,就会给人类未来的工作和生活带来巨大的冲击, 引发不确定性,导致有些人失业,甚至遇到生存问题。
电子钱包让小偷下岗,自动驾驶让司机失业,新冠疫情让商场关门,刚刚松口气又突然紧张,黑天鹅、灰犀牛、独角兽无不让人感觉到现代 社会 的不确定性,正如德国 社会 学家乌尔里希·贝克所指出的, 现代 社会 实际上进入一种风险 社会 。
为人父母,我们希望按照自己的分析和判断,为孩子规划一条道路,让他遵照前行,未来能够找到一个稳定的好工作,有个好收入,拥有好生活。
但是,未来,在很多领域中,机器人将以高效率、不需要休息来抢占人类的饭碗,不仅是脑力劳动的白领,体力劳动的蓝领也不能幸免,造成结构性失业。
什么是结构性失业?按照经济学家的话来说,枯燥,难懂,我试着简单“谱”一下。
李开复说,未来,大部分人类需要思考5秒钟以下的工作都会被取代。 只要有大数据支撑,所有能被理性推理的工作,机械重复的工作,人工智能都能取代人。 比如驾驶、下棋,医院里看X片的医生,保安、护士、银行柜员、货物分拣、翻译、财务统计等等。
从事这些职业的人员,他们因为工作被新的人工智能取代,又不能真正再找到适合他们的工作岗位的情况,就被结构性失业了。
为了避免结构性失业,为了给孩子更好的未来。 很多父母想尽办法,要最早知道将来哪个产业和领域比较吃香,把自己的孩子安排到这个产业领域当中进行学习。
填报大学专业志愿如此,报考各种兴趣班如此,乃至于学龄前也如此,所谓“不要输在起跑线上”。
可是,世界变化如此之快,人工智能发展如此迅速,10年之后,20年之后,当我们的孩子进入职场,到底什么样的产业将被替代,如何替代?人工智能如何迭代?现在,真难以分析和判断。
我们从幼儿园就开始安排的学科和兴趣学习,能保证不被结构性失业吗?
02
君子不器
有人会说,到时候,我总是选择新兴行业不就可以了嘛。
这个想法确实不错,乐观估计的话,只要我们自己跳得够快,永远跟上人工智能的节奏就行。
这样的话,我要说出我今天写这篇文章的核心思想了,就是向中国古人学习。
孔子在《论语》里说到: 君子不器。
从字面上来看,就是人要成为君子,而不是一个器皿、工具、东西、机器。
孔子认为:作为君子,不能像器皿一样成为一个定型的人,不能囿于一技之长,不能只求学到一两门手艺,要博学而通达,不要让自己的才能和思想拘泥于某种“专业”的狭隘中。
现在的大数据和算法已经有把我们困在信息茧房里的迹象了,打开购物平台,推送给你的正是你想要的,打开抖音短视频,印入眼帘的正是你感兴趣的
每个人的时间都被自己最感兴趣的内容填充得满满的,没有精力再去涉猎其他。 推荐算法大大压缩了人们接触到不同信息的机会,我们迅速进入了单向度的信息茧房。
我们每天不断接受着丰富的信息,觉得自己随时随地了解着世界,但实际上这不过是因为自己总能看到感兴趣的东西,从而获得了舒适的错觉。
打破信息茧房的关键是调整我们的心态,愿意接纳不同观点的人,能够听取不一样的声音。
在这样的互联网信息传递中, 孩子的信息茧房也在一天天构建,但他们有着天然的对抗武器——好奇心。
面对人工智能时代,我们能给到孩子的第一项能力,就是保护他们的好奇心。父母毋须用自己固有的思维和观念去局限孩子们的想法,尽量带孩子了解不同领域的信息,多去看看不一样的世界,哪怕看起来是那么的不相干。
我们要尽量少说教,而是放手,让孩子去体验,去经历。
读万卷书,行万里路。
03
提升软实力
每一次工业革命都会带来巨大的结构性失业。
第四次工业革命依然会如此。
创新,创造,正是第四次工业革命带来的时代特征,这个时候,我们不仅仅需要显性知识,或者叫做硬实力,更需要的是隐形知识,也可以叫做软实力。
《溢出》一书的作者,北京大学史学博士,外交学院施展教授写道, 规范化教育所传递的都是显性知识, 但正因为作为前提的隐性知识的存在,“人”才不会被规范化教育单向度地塑造,而是在学习过程中有着一种积极的主体性—通过隐性知识不自觉地决定该如何消化和理解显性知识。
这保障了“人”是学习的主体而不是客体,从而令“人”能够突破给定知识,形成创造力。隐性知识与显性知识在这个过程中不断地相互作用、相互生成。
隐性知识在本质上是一种个体化的理解力、领悟力、判断力镶嵌在实践活动当中,无法通过规范化的方式加以传播。
孔子在《易传》里也说到:形而上者谓之道,形而下者谓之器。道是无形的,器是有形的。
我们看,机器人就是形而下者,是个机器,对数据有强烈的依赖性。虽然它们可以深度学习,乃至创作(画画、d琴等),但总是离不开所有收集的数据。
而人类,就有着机器人无法企及的能力:思考、创造、 情感 与社交。机器人可以画画,但却没有了蒙娜丽莎的微笑,机器人可以写字,却没有王羲之的笔迹游走之情,机器人可以行走,却无法理解为什么非要到冈仁波齐去看繁星漫天
尤其中国人很多的能力,比如盐少许,看火候,依药性配伍,你看着办,分分钟能让机器人崩溃,最后只能学着中国人的语气,来一句:这件事儿啊,您请。
作为很多鸡娃,很多时候我们做爸妈的都是基于现在的市场、人才需要,还有些是依照过去自己走过的路。但是,人工智能以及未来20年后,什么样的能力最能凸显一个人的价值,最具有具有竞争力,谁也不知道十年二十年后会是什么样。
但是, 有些趋势和通用能力我们是知道的,比如自信心、想象力、终身学习力、跨领域的思维力,解难试错的能力
以往我们注重培养孩子的知识和技能等硬实力,尤其看重学科学习,而这样的学习据说来自于美国,是用来培养流水线上工作人员的,说的不好听一点就是培养机器人,很容易被人工智能取代。
《未来简史》大胆预测,就是那些需要 情感 投入的工作未来不会被取代。
面对未来,我们除了给孩子知识技能的学习, 要更注重培养孩子的自信、批判、创造、想象、 情感 、社交等等软实力。
BBC 基于剑桥大学研究者 Michael Osborne 和 Carl Frey 的数据体系分析了 365 种职业在未来的“被淘汰概率”。
看图说话,不难发现,越是机械、重复的劳动,被淘汰率就越高;而需要投入 情感 ,需要团队协同的工作,机器人很难取代。
按照牛津大学经济学家弗雷和奥斯本的说法,难以被人工智能取代的技能主要有3类: 感知能力、社交能力、创造力。
04
拥抱不确定的未来
不确定性、快速迭代、风险看起来令人焦虑,但这恐怕就是现实。
世界的真相就是变化,我们要给到孩子以不变应万变的信念和能力,在人工智能时代依然幸福地生活。
不给孩子灌输确定性、稳定性的逻辑,而更是让孩子不断地拥抱变化,迎接各种挑战和不确定性。
荀子在《劝学》篇里说到: 假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也,善假于物也。
善假于物,我们的孩子将以开放的心态、宽广的胸怀、足够的自信使用驾驭人工智能,创造属于自己的世界!
当下,人工智能成了新时代的必修课,其重要性已无需赘述,但作为一个跨学科产物,它包含的内容浩如烟海,各种复杂的模型和算法更是让人望而生畏。对于大多数的新手来说,如何入手人工智能其实都是一头雾水,比如到底需要哪些数学基础、是否要有工程经验、对于深度学习框架应该关注什么等等。
那么,学习人工智能该从哪里开始呢?人工智能的学习路径又是怎样的?
本文节选自王天一教授在极客时间 App 开设的“人工智能基础课”,已获授权。更多相关文章,请下载极客时间 App,订阅专栏获取。
数学基础知识蕴含着处理智能问题的基本思想与方法,也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上,要了解人工智能,首先要掌握必备的数学基础知识,具体来说包括:
线性代数:如何将研究对象形式化?
概率论:如何描述统计规律?
数理统计:如何以小见大?
最优化理论: 如何找到最优解?
信息论:如何定量度量不确定性?
形式逻辑:如何实现抽象推理?
线性代数:如何将研究对象形式化?
事实上,线性代数不仅仅是人工智能的基础,更是现代数学和以现代数学作为主要分析方法的众多学科的基础。从量子力学到图像处理都离不开向量和矩阵的使用。而在向量和矩阵背后,线性代数的核心意义在于提供了⼀种看待世界的抽象视角:万事万物都可以被抽象成某些特征的组合,并在由预置规则定义的框架之下以静态和动态的方式加以观察。
着重于抽象概念的解释而非具体的数学公式来看,线性代数要点如下:线性代数的本质在于将具体事物抽象为数学对象,并描述其静态和动态的特性;向量的实质是 n 维线性空间中的静止点;线性变换描述了向量或者作为参考系的坐标系的变化,可以用矩阵表示;矩阵的特征值和特征向量描述了变化的速度与方向。
总之,线性代数之于人工智能如同加法之于高等数学,是一个基础的工具集。
概率论:如何描述统计规律?
除了线性代数之外,概率论也是人工智能研究中必备的数学基础。随着连接主义学派的兴起,概率统计已经取代了数理逻辑,成为人工智能研究的主流工具。在数据爆炸式增长和计算力指数化增强的今天,概率论已经在机器学习中扮演了核心角色。
同线性代数一样,概率论也代表了一种看待世界的方式,其关注的焦点是无处不在的可能性。频率学派认为先验分布是固定的,模型参数要靠最大似然估计计算;贝叶斯学派认为先验分布是随机的,模型参数要靠后验概率最大化计算;正态分布是最重要的一种随机变量的分布。
数理统计:如何以小见大?
在人工智能的研究中,数理统计同样不可或缺。基础的统计理论有助于对机器学习的算法和数据挖掘的结果做出解释,只有做出合理的解读,数据的价值才能够体现。数理统计根据观察或实验得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。
虽然数理统计以概率论为理论基础,但两者之间存在方法上的本质区别。概率论作用的前提是随机变量的分布已知,根据已知的分布来分析随机变量的特征与规律;数理统计的研究对象则是未知分布的随机变量,研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断。
用一句不严谨但直观的话讲:数理统计可以看成是逆向的概率论。 数理统计的任务是根据可观察的样本反过来推断总体的性质;推断的工具是统计量,统计量是样本的函数,是个随机变量;参数估计通过随机抽取的样本来估计总体分布的未知参数,包括点估计和区间估计;假设检验通过随机抽取的样本来接受或拒绝关于总体的某个判断,常用于估计机器学习模型的泛化错误率。
最优化理论: 如何找到最优解?
本质上讲,人工智能的目标就是最优化:在复杂环境与多体交互中做出最优决策。几乎所有的人工智能问题最后都会归结为一个优化问题的求解,因而最优化理论同样是人工智能必备的基础知识。最优化理论研究的问题是判定给定目标函数的最大值(最小值)是否存在,并找到令目标函数取到最大值 (最小值) 的数值。 如果把给定的目标函数看成一座山脉,最优化的过程就是判断顶峰的位置并找到到达顶峰路径的过程。
通常情况下,最优化问题是在无约束情况下求解给定目标函数的最小值;在线性搜索中,确定寻找最小值时的搜索方向需要使用目标函数的一阶导数和二阶导数;置信域算法的思想是先确定搜索步长,再确定搜索方向;以人工神经网络为代表的启发式算法是另外一类重要的优化方法。
信息论:如何定量度量不确定性?
近年来的科学研究不断证实,不确定性就是客观世界的本质属性。换句话说,上帝还真就掷骰子。不确定性的世界只能使用概率模型来描述,这促成了信息论的诞生。
信息论使用“信息熵”的概念,对单个信源的信息量和通信中传递信息的数量与效率等问题做出了解释,并在世界的不确定性和信息的可测量性之间搭建起一座桥梁。
总之,信息论处理的是客观世界中的不确定性;条件熵和信息增益是分类问题中的重要参数;KL 散度用于描述两个不同概率分布之间的差异;最大熵原理是分类问题汇总的常用准则。
形式逻辑:如何实现抽象推理?
1956 年召开的达特茅斯会议宣告了人工智能的诞生。在人工智能的襁褓期,各位奠基者们,包括约翰·麦卡锡、赫伯特·西蒙、马文·闵斯基等未来的图灵奖得主,他们的愿景是让“具备抽象思考能力的程序解释合成的物质如何能够拥有人类的心智。”通俗地说,理想的人工智能应该具有抽象意义上的学习、推理与归纳能力,其通用性将远远强于解决国际象棋或是围棋等具体问题的算法。
如果将认知过程定义为对符号的逻辑运算,人工智能的基础就是形式逻辑;谓词逻辑是知识表示的主要方法;基于谓词逻辑系统可以实现具有自动推理能力的人工智能;不完备性定理向“认知的本质是计算”这一人工智能的基本理念提出挑战。
《人工智能基础课》全年目录
本专栏将围绕机器学习与神经网络等核心概念展开,并结合当下火热的深度学习技术,勾勒出人工智能发展的基本轮廓与主要路径。点击我获取学习资源
我们再来看看人工智能,机器学习、大数据技术应用方面有哪些联系与区别
大数据、人工智能是目前大家谈论比较多的话题,它们的应用也越来越广泛、与我们的生活关系也越来越密切,影响也越来越深远,其中很多已进入寻常百姓家,如无人机、网约车、自动导航、智能家电、电商推荐、人机对话机器人等等。
大数据是人工智能的基础,而使大数据转变为知识或生产力,离不开机器学习(Machine Learning),可以说机器学习是人工智能的核心,是使机器具有类似人的智能的根本途径。
本文主要介绍机器有关概念、与大数据、人工智能间的关系、机器学习常用架构及算法等,具体如下:
机器学习的定义
大数据与机器学习
机器学习与人工智能及深度学习
机器学习的基本任务
如何选择合适算法
Spark在机器学习方面的优势
01 机器学习的定义
机器学习是什么?是否有统一或标准定义?目前好像没有,即使在机器学习的专业人士,也好像没有一个被广泛认可的定义。在维基百科上对机器学习有以下几种定义:
“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。
“机器学习是对能通过经验自动改进的计算机算法的研究”。
“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。”
一种经常引用的英文定义是:A computer program is said to learn from experience (E) with respect to some class of tasks(T) and performance(P) measure , if its performance at tasks in T, as measured by P, improves with experience E。
可以看出机器学习强调三个关键词:算法、经验、性能,其处理过程如图所示。
▲机器学习处理流程
上图表明机器学习是使数据通过算法构建出模型,然后对模型性能进行评估,评估后的指标,如果达到要求就用这个模型测试新数据,如果达不到要求就要调整算法重新建立模型,再次进行评估,如此循环往复,最终获得满意结果。
02 大数据与机器学习
我们已进入大数据时代,产生数据的能力空前高涨,如互联网、移动网、物联网、成千上万的传感器、穿戴设备、GPS等等,存储数据、处理数据等能力也得到了几何级数的提升,如Hadoop、Spark技术为我们存储、处理大数据提供有效方法。
数据就是信息、就是依据,其背后隐含了大量不易被我们感官识别的信息、知识、规律等等,如何揭示这些信息、规则、趋势,正成为当下给企业带来高回报的热点。
而机器学习的任务,就是要在基于大数据量的基础上,发掘其中蕴含并且有用的信息。其处理的数据越多,机器学习就越能体现出优势,以前很多用机器学习解决不了或处理不好的问题,通过提供大数据得到很好解决或性能的大幅提升,如语言识别、图像设别、天气预测等等。
03 机器学习、人工智能及深度学习
人工智能和机器学习这两个科技术语如今已经广为流传,已成为当下的热词,然而,他们间有何区别?又有哪些相同或相似的地方?虽然人工智能和机器学习高度相关,但却并不尽相同。
人工智能是计算机科学的一个分支,目的是开发一种拥有智能行为的机器,目前很多大公司都在努力开发这种机器学习技术。他们都在努力让电脑学会人类的行为模式,以便推动很多人眼中的下一场技术革命——让机器像人类一样“思考”。
过去10年,机器学习已经为我们带来了无人驾驶汽车、实用的语音识别、有效的网络搜索等等。接下来人工智能将如何改变我们的生活?在哪些领域最先发力?我们拭目以待。
对很多机器学习来说,特征提取不是一件简单的事情。在一些复杂问题上,要想通过人工的方式设计有效的特征集合,往往要花费很多的时间和精力。
深度学习解决的核心问题之一就是自动地将简单的特征组合成更加复杂的特征,并利用这些组合特征解决问题。深度学习是机器学习的一个分支,它除了可以学习特征和任务之间的关联以外,还能自动从简单特征中提取更加复杂的特征。下图展示了深度学习和传统机器学习在流程上的差异。如图所示,深度学习算法可以从数据中学习更加复杂的特征表达,使得最后一步权重学习变得更加简单且有效。
▲机器学习与深度学习流程对比
前面我们分别介绍了机器学习、人工智能及深度学习,它们间的关系如何?
▲人工智能、机器学习与深度学习间的关系
人工智能、机器学习和深度学习是非常相关的几个领域。上图说明了它们之间大致关系。人工智能是一类非常广泛的问题,机器学习是解决这类问题的一个重要手段,深度学习则是机器学习的一个分支。在很多人工智能问题上,深度学习的方法突破了传统机器学习方法的瓶颈,推动了人工智能领域的快速发展。
04 机器学习的基本任务
机器学习基于数据,并以此获取新知识、新技能。它的任务有很多,分类是其基本任务之一。分类就是将新数据划分到合适的类别中,一般用于类别型的目标特征,如果目标特征为连续型,则往往采用回归方法。回归是对新目标特征进行预测,是机器学习中使用非常广泛的方法之一。
分类和回归,都是先根据标签值或目标值建立模型或规则,然后利用这些带有目标值的数据形成的模型或规则,对新数据进行识别或预测。这两种方法都属于监督学习。与监督学习相对是无监督学习,无监督学习不指定目标值或预先无法知道目标值,它可以将把相似或相近的数据划分到相同的组里,聚类就是解决这一类问题的方法之一。
点击我获取学习资源
除了监督学习、无监督学习这两种最常见的方法外,还有半监督学习、强化学习等方法,这里我们就不展开了,下图展示了这些基本任务间的关系。
▲机器学习基本任务的关系
05 如何选择合适算法
当我们接到一个数据分析或挖掘的任务或需求时,如果希望用机器学习来处理,首要任务是根据任务或需求选择合适算法,选择哪种算法较合适?分析的一般步骤为:
▲选择算法的一般步骤
充分了解数据及其特性,有助于我们更有效地选择机器学习算法。采用以上步骤在一定程度上可以缩小算法的选择范围,使我们少走些弯路,但在具体选择哪种算法方面,一般并不存在最好的算法或者可以给出最好结果的算法,在实际做项目的过程中,这个过程往往需要多次尝试,有时还要尝试不同算法。不过先用一种简单熟悉的方法,然后,在这个基础上不断优化,时常能收获意想不到的效果。
简单的说,人工智能主要指算法,相当于人的大脑,运用功能模拟的方法,制造电脑模拟人脑的部分功能,把人的部分智能活动机械化,其中更侧重在模拟的算法。人工智能由高科技人才和实验室支撑着,偏重前沿技术领域。如谷歌收购的DeepMind就属于深度学习算法公司,重在高科技人才对算法的新研发。
机器人更多的是各项科技的整合。机器人整机,相当做整个人的概念。牵扯的东西很多很多,既要能行动,又要能够交互。机器人是各个科学的结晶,从材料科学、机械工程、电子工程、计算机工程、软件工程等。如中国目前出名的机器人公司“优必选”。
IOT是什么?它是Internet Of Things的缩写,指的是智能家具、可穿戴,这些可以连上网的低智能含量的东西,统称为物联网。这类东西有运算能力,也叫智能,但算法的复杂度远达到被称为人工智能的地步。另外,它们也称不上是机器人,因为这个东西实在太简单,太简陋了。较为常见的智能灯泡、茶座,智能手表等,都叫IOT。如中国人工智能新秀“出门问问”,就有研发可问答的智能穿戴时尚手表。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)