算力可贵,效率价高:智算中心凭啥是筑基新基建的最优解?

算力可贵,效率价高:智算中心凭啥是筑基新基建的最优解?,第1张

在“新基建”浪潮下,人工智能正成为经济增长的新引擎,各行各业开启智能化升级转型。算力在其中扮演了重要角色,是国家未来竞争力的集中体现。但事实是,在发展的过程中,高速增长的海量数据与更加复杂的模型,正在为算力带来更大的挑战,主要体现为算力不足,效率不高。


算力诚可贵:数据、算法需要更多算力支撑


众所周知,在人工智能发展的三要素中,无论是数据还是算法,都离不开算力的支撑,算力已成为人工智能发展的关键要素。


IDC发布的《数据时代2025》报告显示,2018年全球产生的数据量为33ZB (1ZB=1万亿GB),到2025年将增长到175ZB,其中,中国将在2025年以486ZB的数据量及278%的占比成为全球最大的数据汇集地。



另据赛迪顾问数据显示,到2030年数据原生产业规模量占整体经济总量的15%,中国数据总量将超过4YB,占全球数据量30%。数据资源已成为关键生产要素,更多的产业通过利用物联网、工业互联网、电商等结构或非结构化数据资源来提取有价值信息,而海量数据的处理与分析对于算力的需求将十分庞大。



算法上,先进模型的参数量和复杂程度正呈现指数级的增长趋势。此前 Open AI 发表的一项研究就显示,每三到四个月,训练这些大型模型所需的计算资源就会翻一番(相比之下,摩尔定律有 18 个月的倍增周期)。2012 至 2018 年间,深度学习前沿研究所需的计算资源更是增加了 30 万倍。



到2020年,深度学习模型对算力的需求达到了每天百亿亿次的计算需求。2020年2月,微软发布了最新的智能感知计算模型Turing-NLG,参数量高达到175亿,使用125POPS AI计算力完成单次训练就需要一天以上。随后,OpenAI又提出了GPT-3模型,参数量更达到1750亿,对算力的消耗达到3640 PetaFLOPS/s-day。而距离GPT-3问世不到一年,更大更复杂的语言模型,即超过一万亿参数的语言模型SwitchTransformer即已问世。


由此可见,高速增长的海量数据与更加复杂的模型,正在给算力带来更大的挑战。如果算力不能快速增长,我们将不得不面临一个糟糕的局面:当规模庞大的数据用于人工智能的训练学习时,数据量将超出内存和处理器的承载上限,整个深度学习训练过程将变得无比漫长,甚至完全无法实现最基本的人工智能。


效率价更高:环境与实际成本高企,提升效率迫在眉睫


在计算工业行业,有个假设是“数字处理会变得越来越便宜”。但斯坦福人工智能研究所副所长克里斯托弗•曼宁表示,对于现有的AI应用来说却不是这样,特别是因为不断增加的研究复杂性和竞争性,使得最前沿模型的训练成本还在不断上升。


根据马萨诸塞大学阿默斯特校区研究人员公布的研究论文显示,以常见的几种大型 AI 模型的训练周期为例,发现该过程可排放超过 626000 磅二氧化碳,几乎是普通 汽车 寿命周期排放量的五倍(其中包括 汽车 本身的制造过程)。



例如自然语言处理中,研究人员研究了该领域中性能取得最大进步的四种模型:Transformer、ELMo、BERT和 GPT-2。研究人员在单个 GPU 上训练了至少一天,以测量其功耗。然后,使用模型原始论文中列出的几项指标来计算整个过程消耗的总能量。


结果显示,训练的计算环境成本与模型大小成正比,然后在使用附加的调整步骤以提高模型的最终精度时呈爆炸式增长,尤其是调整神经网络体系结构以尽可能完成详尽的试验,并优化模型的过程,相关成本非常高,几乎没有性能收益。BERT 模型的碳足迹约为1400 磅二氧化碳,这与一个人来回坐飞机穿越美洲的排放量相当。



此外,研究人员指出,这些数字仅仅是基础,因为培训单一模型所需要的工作还是比较少的,大部分研究人员实践中会从头开发新模型或者为现有模型更改数据集,这都需要更多时间培训和调整,换言之,这会产生更高的能耗。根据测算,构建和测试最终具有价值的模型至少需要在六个月的时间内训练 4789 个模型,换算成碳排放量,超过 78000 磅。而随着 AI 算力的提升,这一问题会更加严重。


另据 Synced 最近的一份报告,华盛顿大学的 Grover 专门用于生成和检测虚假新闻,训练较大的Grover Mega模型的总费用为25万美元;OpenAI 花费了1200万美元来训练它的 GPT-3语言模型;谷歌花费了大约6912美元来训练 BERT,而Facebook针对当前最大的模型进行一轮训练光是电费可能就耗费数百万美元。


对此,Facebook人工智能副总裁杰罗姆•佩森蒂在接受《连线》杂志采访时认为,AI科研成本的持续上涨,或导致我们在该领域的研究碰壁,现在已经到了一个需要从成本效益等方面考虑的地步,我们需要清楚如何从现有的计算力中获得最大的收益。


在我们看来,AI计算系统正在面临计算平台优化设计、复杂异构环境下计算效率、计算框架的高度并行与扩展、AI应用计算性能等挑战。算力的发展对整个计算需求所造成的挑战会变得更大,提高整个AI计算系统的效率迫在眉睫。


最优解:智算中心大势所趋,应从国家公共设施属性做起


正是基于上述算力需求不断增加及所面临的效率提升的需要,作为建设承载巨大AI计算需求的算力中心(数据中心)成为重中之重。


据市场调研机构Synergy Research Group的数据显示,截至到2020年第二季度末,全球超大规模数据中心的数量增长至541个,相比2015年同期增长一倍有余。另外,还有176个数据中心处于计划或建设阶段,但作为传统的数据中心,随之而来的就是能耗和成本的大幅增加。



这里我们仅以国内的数据中心建设为例,现在的数据中心已经有了惊人的耗电量。据《中国数据中心能耗现状白皮书》显示,在中国有 40 万个数据中心,每个数据中心平均耗电 25 万度,总体超过 1000 亿度,这相当于三峡和葛洲坝水电站 1 年发电量的总和。如果折算成碳排放则大概是 9600 万吨,这个数字接近目前中国民航年碳排放量的 3 倍。


但根据国家的标准,到2022年,数据中心平均能耗基本达到国际先进水平,新建大型、超大型数据中心的 PUE(电能使用效率值,越低代表越节能)达到 14 以下。而且北上广深等发达地区对于能耗指标控制还非常严格,这与一二线城市集中的数据中心需求形成矛盾,除了降低 PUE,同等计算能力提升服务器,尤其是数据中心的的计算效率应是正解。


但众所周知的事实是,面对前述庞大的AI计算需求和提升效率的挑战,传统数据中心已经越来越难以承载这样的需求,为此,AI服务器和智算中心应运而生。


与传统的服务器采用单一的CPU不同,AI服务器通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求,为自然语言处理、计算机视觉、语音交互等人工智能应用场景提供强大的算力支持,已经成为人工智能发展的重要支撑力量。


值得一提的是,目前在AI服务器领域,我们已经处于领先的地位。


近日,IDC发布了2020HI《全球人工智能市场半年度追踪报告》,对2020年上半年全球人工智能服务器市场进行数据洞察显示,目前全球半年度人工智能服务器市场规模达559亿美元(约3266亿人民币),其中浪潮以164%的市占率位居全球第一,成为全球AI服务器头号玩家,华为、联想也杀入前5(分别排在第四和第五)。


这里业内也许会好奇,缘何中国会在AI服务器方面领跑全球?



以浪潮为例,自1993年,浪潮成功研制出中国首台小型机服务器以来,经过30年的积累,浪潮已经攻克了高速互联芯片,关键应用主机、核心数据库、云数据中心 *** 作系统等一系列核心技术,在全球服务器高端俱乐部里占有了重要一席。在AI服务器领域,从全球最高密度AGX-2到最高性能的AGX-5,浪潮不断刷新业界最强的人工智能超级服务器的纪录,这是为了满足行业用户对人工智能计算的高性能要求而创造的。浪潮一直认为,行业客户希望获得人工智能的能力,但需要掌握了人工智能落地能力的和技术的公司进行赋能,浪潮就可以很好地扮演这一角色。加快人工智能落地速度,帮助企业用户打开了人工智能应用的大门。


由此看,长期的技术创新积淀、核心技术的掌握以及对于产业和技术的准确判断、研发是领跑的根本。


至于智算中心,去年发布的《智能计算中心规划建设指南》公布了智能计算中心技术架构,基于最新人工智能理论,采用领先的人工智能计算架构,通过算力的生产、聚合、调度和释放四大作业环节,支撑和引领数字经济、智能产业、智慧城市和智慧 社会 应用与生态 健康 发展。



通俗地讲,智慧时代的智算中心就像工业时代的电厂一样,电厂是对外生产电力、配置电力、输送电力、使用电力;同理智算中心是在承载AI算力的生产、聚合、调度和释放过程,让数据进去让智慧出来,这就是智能计算中心的理想目标。


需要说明的是,与传统数据中心不同,“智算中心”不仅把算力高密度地集中在一起,而且要解决调度和有效利用计算资源、数据、算法等问题,更像是从计算器进化到了大脑。此外,其所具有的开放标准,集约高效、普适普惠的特征,不仅能够涵盖融合更多的软硬件技术和产品,而且也极大降低了产业AI化的进入和应用门槛,直至普惠所有人。



其实我们只要仔细观察就会发现,智算中心包含的算力的生产、聚合、调度和释放,可谓集AI能力之大成,具备全栈AI能力。


这里我们不妨再次以浪潮为例,看看何谓全栈AI能力?


比如在算力生产层面,浪潮打造了业内最强最全的AI计算产品阵列。其中,浪潮自研的新一代人工智能服务器NF5488A5在2020年一举打破MLPerf AI推理&训练基准测试19项世界纪录(保证充足的算力,解决了算力提升的需求);在算力调度层面,浪潮AIStation人工智能开发平台能够为AI模型开发训练与推理部署提供从底层资源到上层业务的全平台全流程管理支持,帮助企业提升资源使用率与开发效率90%以上,加快AI开发应用创新(解决了算力的效率问题);在聚合算力方面,浪潮持续打造更高效率更低延迟硬件加速设备与优化软件栈;在算力释放上,浪潮AutoML Suite为人工智能客户与开发者提供快速高效开发AI模型的能力,开启AI全自动建模新方式,加速产业化应用。


那么接下来的是,智算中心该遵循怎样的发展路径才能充分发挥它的作用,物尽其用?


IDC调研发现,超过九成的企业正在使用或计划在三年内使用人工智能,其中745%的企业期望在未来可以采用具备公用设施意义的人工智能专用基础设施平台,以降低创新成本,提升算力资源的可获得性。


由此看,智能计算中心建设的公共属性原则在当下和未来就显得尤为重要,即智能计算中心并非是盈利性的基础设施,而是应该是类似于水利系统、水务系统、电力系统的公共性、公益性的基础设施,其将承载智能化的居民生活服务、政务服务智能化。因此,在智能计算中心规划和建设过程中,要做好布局,它不应该通过市场竞争手段来实现,而要体现政府在推进整个 社会 智能化进程的规划、节奏、布局。


总结: 当下,算力成为推动数字经济的根基和我国“新基建“的底座已经成为共识,而如何理性看待其发展中遇到的挑战,在不断高升算力的前提下,提升效率,并采取最佳的发展策略和形式,找到最优解,将成为政府相关部门以及相关企业的重中之重。

近日,由Cambridge Wireless(CW)与华为合作共建的5G加速营第一期圆满结束。入营企业的演示活动在剑桥启迪 科技 园生命 科技 创新中心举办,三家企业分别展示了不同技术领域在5G环境下可实现的技术壁垒的突破以及颠覆性成果。
Extend Robotics是帝国理工学院的衍生企业,基于VR技术提供可远程 *** 作的多功能机械臂解决方案。其推出的遥控机械手臂及技术可运用于餐饮行业,以及部分目前人类能力无法触及的领域,如核设施退役、公用事业行业检查与维护、 健康 医疗和公共服务等行业。

*** 作人员佩戴Extend Robotics的VR设备,在5G环境下通过运用程序cloudVR来 *** 作遥控机械手臂成功将啤酒倒入玻璃杯中

在演示中,Extend Robotics展示了5G如何解决延迟问题。5G带来的大于20Mbps的一致带宽支持了其解决方案的批量RGB-D数据传输和双倍的相机数量,使得延迟时间缩短至20毫秒以内。相较于在4G环境下超过500毫秒延迟相比,5G环境下可实现机械臂在任何区域的实时 *** 作,这是前几代移动技术无法实现的突破性进展。目前,Extend Robotics与QuarkXR建立了联系,共同开发了支持5G的cloudVR 解决方案,并将总成本降低了30%。

Chang Liu

Extend Robotics创始人兼首席执行官
“ 延迟是影响用户使用体验的关键因素之一,5G技术很完美的帮助我们解决了这个问题。”
Ubisense公司是全球实时定位系统(RTLS)的领导者,通过精确实时定位系统追踪人员和资产以实现企业业务自动化,增强管理者对室内/室外追踪的可视性和控制力。其研发的SmartSpace平台通过在工具和物品上放置标签,并与传感器连接,从而实现实时定位及工厂运作监控,并监测和控制计划外活动。Ubisense目前已成功运用于主要 汽车 制造生产工厂。

Ubisense创始人兼首席技术官Andy Ward在活动中介绍5G技术使其产品性能提升

在活动中,Ubisense展示了5G技术如何优化成本问题。5G设备具备低成本与高性能的优势,通过对工厂资产跟踪的成本比较显示,相较于当前的有线解决方案,采用5G设备可将成本降低60%。尤其是在减少电缆损坏和人为错误以及提高传感器部署的便利性方面表现突出,达到了计划目标性能水平 - 实现网络负载可接受的三维30厘米的定位水准。

Andy Ward

Ubisense创始人兼首席技术官

“ 5G对于我们来讲帮助非常大,由于用于跟踪工厂物品的传感器系统非常密集,每个传感器都需要联网。通过无线而不是电缆连接传感器将大幅降低成本且更易 *** 作,并且在需要重新配置时更易移动。通过CW的5G加速营让我们接触真正5G网络,通过实验测试5G在实践中的效果如何。结果表明,实际性能与预测性能一样好,将有助于让我们的客户相信未来可依靠5G连接来部署传感器系统。”

Camnexus致力于开发端对端的物联网解决方案,从而实现工业领域数字化转型,尤其侧重于水务领域。其低功耗物联网网络可帮助农民和城市规划者测试农业用水和日常用水是否有泄漏,甚至是否有冠状病毒颗粒等情况。Camnexus现有的解决方案已在巴西和智利部署,提升了现有基础设施的d性,减少浪费的同时提高质量。Camnexus下一步将在乌干达进行试验。Camnexus使用的低功耗广域网 (LPWAN) 是一种无线广域网技术,可在长距离内以低比特率互连低带宽和电池供电设备。

Camnexus展示了5G技术如何助力实现高清视频直播与大规模物联网场景同步的技术突破。通过过去三个月的测试,5G上行链路将作为新功能添加于Camnexus LPWAN网关:KUBO800(适用于欧洲和非洲市场)和 KUBO900(适用于美洲和澳大利亚市场)。在包含 200 个节点和两个高清视频流的海量物联网模拟场景中,5G表现出比3G/4G更高的可靠性。结果证明Camnexus的LPWAN-5G基础设施和无缝解决方案,可将实时或更高带宽应用程序集成到专用大规模物联网解决方案中,从而巩固现有基础设施。

Camnexus创始人兼首席执行官Jessica Ocampos在活动中展示5G技术为其带来的业务技术突破

此外,Camnexus通过5G Testbed的私人5G网络和Espacio 5G和Entel协助下,在活动中实现了英国和智利的第一次国际在线视频会议。本次视频通话也被智利媒体进行了报导。在视频通话中,Camnexus与位于智利圣地亚哥的团队一起对供水公司的污水处理问题进行实 *** : 当警报器被触发时,人们可以看到站点异常的视频直播。

Jessica Ocampos

Camnexus创始人兼首席执行官
“本次加速营使我们有机会深入了解5G技术,并且在5G环境下进行研究并取得如何在工业物联网中运用该技术的宝贵经验。与5G的集成整合拓展的新功能具有高可靠性和低延迟的优势,助力解决方案的智能处理系统,可检测是否有警报发出,并由此决定是否向 *** 作现场派遣任何援助团队,这对卫生、农业和采矿业意义重大。另外,在新冠期间,我们实现了相距10,000公里的首次5G端对端高清视频流和大规模物联网场景的同步模拟,这将对我们全球的客户产生巨大影响。”

第三期加速营招募

CW与华为共建的5G Testbed位于剑桥启迪 科技 园生命 科技 创新中心。中心配备先进设备,为加速营及企业提供完善配套设施。第三期加速营企业招募已开启,有兴趣加入加速营或有意与入营企业进一步沟通,请联系: info@tusparkcouk

机会:

一,高科技下游产业和商业应用。

5G、数据中心、云计算、智算中心、卫星互联网等这些高科技,需要巨额的投入和长时间的积累,还需要庞大的高端技术人才,这些都不是普通人能够涉足的领域。只有大型国企,以及阿里巴巴、百度、腾讯、华为这些顶尖的高科技企业才能参与竞争。

所以,普通人想要通过创业来抓住新基建的机会,只能往产业链的下游去寻找,或者开发应用。产业链下游细分领域多,门槛较低,容易进入其中。比如5G商用之后,社交电商、在线教育、视频直播等,都是不错的个人创业项目。

二,数字乡村。

相对于城市来说,乡村的数字化更有发展空间。毕竟许多城市的数字化已经发展到了一定的程度,创业空间早已被大企业挤占得差不多了,机会很少。而乡村的数字化则正处于萌芽期,创业机会较多。

新基建主要包括三方面内容:

一是信息基础设施,包括以5G、物联网、工业互联网、卫星互联网为代表的通信网络基础设施;以人工智能、云计算、区块链等为代表的新技术基础设施;以数据中心、智能计算中心为代表的算力基础设施等。

二是融合基础设施,主要指深度应用互联网、大数据、人工智能等技术,支撑传统基础设施转型升级,进而形成的融合基础设施,比如,智能交通基础设施、智慧能源基础设施等。

三是创新基础设施,主要是指支撑科学研究、技术开发、产品研制的具有公益属性的基础设施,比如,重大科技基础设施、科教基础设施、产业技术创新基础设施等。

当今,随着时代的快速发展和科技水平的不断提高,人类逐渐进入了信息化时代。其中,物流行业也从过去20年前的粗放式管理模式逐渐转变为信息化、智慧化的管理模式。
5G、云计算、AI、物联网等新技术的出现加速了各行各业运营方式的转变,和其他行业一样,物流行业也在经历着一场巨大的变革。新技术使物流产业链中的人、车、货、仓、店等要素之间产生了紧密的协同关系,并走向智慧化和智能化。而这,也必将为物流行业带来全新的商业模式。
新技术驱动新轮供应链和物流变革
随着信息技术快速迭代更新,新技术正改变着物流与供应链业务中各个节点和角色的关系,驱动着供应链与物流行业的变革。如今,提高自动化、智能化水平,促使整个物流业从人力密集型向技术密集型转变,已成为目前物流行业最强烈且迫切的需求。结合面向物流企业的调研,我们不难看到,越来越多的物流企业正在进行供应链的数字化转型布局。
在供应链与物流的发展方面,从制造商到品牌商,再到终端用户的供应链数字化转型中,各个参与方都在发生着一些改变。
简单来讲,这是技术发展带来的供应链数字化革命。新技术在供应链起到的作用是提供可视化、数字化和协同化支撑,实现不同角色的协同和信息传递的无缝链接与全面联动,让端到端的整体流转效率变得更高。
回看快递、即时配送等在较短时间内快速发展的物流细分领域,不难发现,物流作为基础服务业,近年每次突破性发展的背后,都是技术驱动新轮商业变对供应链的新需求带动的,而供应链与物流这一轮变革,无疑就是基于物联网的数字化技术。
众所周知,物流是一个重线下的业态场景,有大量的线下设备。工厂、仓储、干线、末端、车辆、人员、货物、门店等全物流要素通过物联网、5G进行连接,然后才能叠加人工智能、算法等技术,各个要素基于数字技术产生紧密协同,从而驱动整个物流业从人力密集型向技术密集型转型。
围绕5G+云+AI等核心技术,众多创新企业借道科技进入物流领域,为行业搭建信息化的基础设施。目前包括华为在内的很多企业已经将大量前沿、新兴科技深入应用在从拣选到分拨,从干线到末端的物流领域各个环节。
打造物流行业“智慧引擎”
作为智慧物流解决方案提供商,依托AI、物联网以及区块链等技术,华为云能够很好地支撑并打通仓储、运输、配送等物流全业务场景,实现物流运输全程可视可追踪、物流多方数据协同可视可信以及智慧园区人、车、货、场的全联接。
1)物流+AI:全栈AI重塑智慧物流未来
目前华为云聚焦物流行业常见场景,依托华为全栈全场景AI解决方案,以模块化构建云服务,为物流企业提供防暴力分拣、分拣路径优化、OCR单据识别、运输路径优化等智慧物流解决方案。
以防暴力分拣为例,华为云EI智能分析能够通过对监控视频进行实时行为分析,自动识别拣货员在拣货过程中出现的扔、抛、推倒、用力踢等暴力分拣行为,自动输出暴力分拣片段,及发生的时间和地点。在多车多人的复杂场景下,暴力分拣算法的识别准确率为68%,召回率降低40%,能大量减少人工监控成本,且有效降低暴力分拣行为的发生。
通过打造一站式解决方案,华为云帮助企业在仓储、运输、配送等各个环节全面提升效率,助力物流行业敏捷创新,实现物流管理的数字化、信息化和智能化。
2)物流+IoT:实现泊位和卸货信息多方协同,提高调度效率
物联网在物流行业中的应用具有规模性、技术性和易管理性等特征。基于这些特征,物联网技术将在很大程度上改变物流行业的运营模式。
具体来讲,在信息协同技术的加持下,物流企业内部的信息将得到高度的集成和整合,使得企业内部能实时了解货物动态,并根据货物的动态进行必要的物流控制。同时,物流信息在物联网的环境下,有助于资源的优化配置和整合,使运行效率大大提高。有效的传输物流企业所需要的即时信息,帮助企业分析解决问题,及时、有效做出决策,提高内部的运作效率,提升物流服务水平。
3)物流+区块链:实现物流多方数据协同可视、可信
借助区块链技术,华为构建了由生产商、仓储方、物流商、客户共同参与的区块链协作平台。在该平台中,货物的生产、仓储、干线物流,以及经销商、本地配送、终端客户等环节信息,均可上链存储。
因为数据上链后就极难被篡改,一旦物流环节出现问题,各个参与方就可以很容易地实现对物流货物的追踪。基于区块链协作平台,物流供应链的参与方们不再需要大量工具、流程就可以保证物流信息的真实性。同时,也可以很快速地完成对货物的跟踪、签收与底层结算。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/13046421.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存