“东数西算”的智慧大脑!26座城市抢建智算中心

“东数西算”的智慧大脑!26座城市抢建智算中心,第1张

智东西(公众号:zhidxcom)

作者 | 杨畅

编辑 | 李水青

智东西2月25日消息,近日,“东数西算”国家项目正式启动,为数据中心产业带来了重要利好信号。(《 历史 时刻!“东数西算”国家工程全面启动》)

作为数据中心中领域的一颗“明珠”,智算中心也引起行业关注。

一般认为,智算中心全称是人工智能计算中心,主要是为人工智能(AI)应用提供所需算力服务、数据服务和算法服务,由AI芯片和算力机组等设备组成,与云计算中心、超算中心有一定区别。企业和研究机构可以依托智算中心提供的强大算力,驱动AI模型进行数据深度加工,实现AI应用创新。

“东数西算”国家项目强调在京津冀、长三角、成渝等八大枢纽间建设算力网络,支持全国各地日益增长的算力需求。而沿着这张算力网络“地图”,我们发现智算中心已经“遍地开花”。

细数过来,从2021年到2022年开年,全国有不下20座城市建成或正在建智算中心,智算中心数量达到27个,而其中位于八大枢纽的就有12个,接近50%。

“东数西算”工程国家算力枢纽节点范围内的智算中心

那么具体有哪些城市在建设或者规划建设智算中心?“东数西算”工程会对智算中心带来什么样的影响?各地智算中心项目建设进度如何?可能会对当地AI产业有何影响?

智东西通过调查2021年以来各地规划、建设和建成的智算中心,并与业内人士交流,来与大家一起探讨这些问题。

据智东西统计,从2021年1月1日到2022年2月15日,全国共有至少26个城市在推动或刚刚完成当地智算中心的建设,这些城市中既有省会城市,例如南京、西安,也有非省会城市,像许昌、青岛。

其中,不少城市已经在本地建设了像大数据中心、云计算中心、国家超算中心等信息基础设施。不过这些中心并不能替代智算中心,它们之间的功能存在差异——像云计算中心,主要是提供云服务,超算中心主要为科学研究提供超算服务,智算中心则主要是为企业和科研院所提供普惠AI算力服务。

此外,中信所《人工智能计算中心发展白皮书(2021)》中指出,智算中心借鉴了超级计算(高性能计算)中心和云计算数据中心大规模并行计算和数据处理的技术架构,但它是以AI专用芯片为计算算力底座的。上述三类中心的软件和业务架构不一样,不过云数据中心和超算中心也可以通过延展建设,来对外提供智能算力。

据我们统计,2021年,全国建成并投入运营或试运营的智算中心有8个,分别是武汉人工智能计算中心、合肥先进计算中心、南京智能计算中心、中国电信京津冀大数据智能算力中心、浙江(长三角)新一代全功能智能超算中心、西安未来人工智能计算中心、中原人工智能计算中心、哈尔滨人工智能先进计算中心,投运时间分别是5月、6月、7月、8月、9月、9月、10月和12月。这些智算中心中大部分都有二期建设规划。

截至目前,2021年和2022年各地投入运营的智算中心情况

一些智算中心并没有直接用“智算中心”或“人工智能计算中心”命名,而是采用“先进计算中心”或“智能超算中心”的命名方式,但它们也提供智能算力,所以也可以算作智算中心,例如合肥先进计算中心和浙江(长三角)新一代全功能智能超算中心。

不同智算中心的测算算力时采用的算力测试基准有所差别,使用算力单位略有不同,但是无论是“1 P OpS”、“1 PFLOPS FP16”、“1 Petaflops”还是“1 P”,都相当于每秒可进行一千万亿次运算。

2022年开年以来,国内已经有一个新投运的智算中心,是位于上海的商汤 科技 人工智能计算中心。

很多城市是正在建设智算中心,从2021年1月1日到2022年2月15日,全国共有至少18个城市签约、开工、招标、计划建设智算中心项目,其中已经宣布开工建设的至少有6个城市,分别是合肥、庆阳、大连、沈阳、深圳、长沙。

截至目前,2021年和2022年各地规划或已经开始建设的智算中心情况

对比2021年之前的各地智算中心建设情况来看,2020年之前的智算中心项目更少一些。不过,部分2021年开工建成的智算中心其实在2020年就已经立项招标和预研规划,比如武汉人工智能计算中心项目。

智算中心并不是2021年才有的新类型数据中心,我国较早建成的智算中心还有深圳鹏城云脑、旷视芜湖AI超算中心等。2018年,鹏城云脑I初步建成并上线运行,算力达到100 PFLOPS(1 PFLOPS相当于每秒运算能力为一千万亿次)。

从全国智算中心的地理位置分布来看,目前,东部、中部和西部都有省市在部署智算中心。作为数据中心的一种,各地的智算中心建设规划难免会受到“东数西算”政策的影响。

特别是国家发改委等部门在《全国一体化大数据中心协同创新体系算力枢纽实施方案》等文件中指出:“原则上,对于在国家枢纽节点之外新建的数据中心,地方政府不得给予土地、财税等方面的优惠政策。”智算中心作为各地政府主导的项目,极有可能受到影响,但是并不一定会大批向西部地区迁移。因为智算中心主要面向AI相关产业,这些业务对于网络通信的要求也比较高,在这方面,东部地区略有优势。

中科曙光高级副总裁任京暘告诉智东西,“东数西算”工程会促进智算中心的发展,预计在全国一体化算力网络国家枢纽节点建设中,规划的数据中心项目会配置一定规模的智能算力,有些项目还可能是直接以智算中心的形态出现。

另外,从这些智算中心公布的算力规模情况来看, 100P算力是很多智算中心的起步目标

一般认为,100P大约相当于5万台高性能电脑的算力。拿科研场景为例,天文学家在20万颗天体的星空图中要定位某种特征星体,如果算力不够,耗时可能要超100天,如果拥有100P算力,定位星体所需时间仅为100秒。

任京暘说,一般智算中心提到的100P是指FP16或INT16,即半精度算力,就现阶段而言,以100P起步,能实现比较大的规模效益。

从需求角度看,智算中心作为城市级公共算力平台,要满足区域内政府、企业、高校等各类用户的算力需求,起步规模不宜过小,否则无法支撑类似大模型训练等大算力需求,也不足以发挥集约共享的规模效益。

任京暘补充道,从投资角度看,智算中心发展尚处于初期阶段,建设、运营、应用与生态建设等投入较大,需要结合地方财政承受能力做出合理评估,根据实际需求进行适度的超前部署。

大部分智算中心都是分期建设的,建成一期,就可以投入运营一期,后期再根据运行情况和产业发展需求进行二期、三期建设。

例如武汉人工智能计算中心,该智算中心在2021年5月完成了一期项目建设工作,并开始为企业提供AI算力,但很快饱和了。于是,武汉人工智能计算中心又进行了二期项目扩容工作,将算力规模从100P扩容到200P。武汉人工智能计算中心相关负责人在接受媒体采访时说,现在二期算力也接近饱和,随着准备进行进一步的算力扩容工作。

武汉人工智能计算中心

根据各智算中心的数据,至少数百家企业已经签约智算中心,例如武汉人工智能计算中心已经为多家高校和科研院所、100多家企业提供算力,南京智能计算中心已经吸引超40家产学研机构入驻。

一个智算中心可以同时支撑的产业场景很多,例如自动驾驶、智慧医疗、智慧城市、智慧交通、智慧矿山、智能制造等等,主要看当地的需求,一般都是为了支撑当地的优势产业更好发展。比如,青岛靠近海域,其人工智能计算中心招标文件就有提到青岛人工智能计算中心要支撑青岛优势产业集群,比如智能家居、智能制造等产业智能化持续领先,并着重强调支撑当地智慧海洋经济的发展。

上述智算中心都并不局限于支撑单一产业。不过,也有一些城市选择建设针对性更强的智算中心,像山西晋城建设了专门面向煤炭行业的智算中心(智能矿山创新实验室创新成果&计算中心)。该智算中心由华为、晋能控股等企业参与建设,主要是为推动山西煤矿智能化建设。

智能矿山创新实验室创新成果&计算中心

在智算中心建设过程中,市政和建筑设计企业背后的AI和ICT企业是重要角色,例如曙光、华为、浪潮、腾讯、商汤 科技 等企业。

在 探索 智算中心过程中,作为计算领域的头部玩家曙光提出了“5A级”智算中心建设方案,从开放、融合、绿色、普惠、服务五个方面,进行智算中心相关的实践和 探索 。目前,曙光5A级智算中心已在广东珠海、安徽合肥、浙江桐乡等地陆续落成,其江苏昆山等地的智算中心也进入建设阶段。

合肥先进计算中心

曙光智算中心会采用兼容多种芯片、算法、模型等的多元协作方式以实现多元算力提供。例如曙光参建的合肥先进计算中心不仅能提供智能算力,还能提供高性能计算所需算力。在降低智算中心、数据中心能耗方面,曙光研发有浸没式相变液冷技术,可使智算中心的PUE值降至104到105。

华为应该是比较早尝试智算中心的企业,而且也是参与各地智算中心建设最多的企业之一。华为升腾计算业务总裁许映童曾在2021世界人工智能大会期间透露,华为希望在2021年内启动超20个智算中心建设。

包括“鹏城云脑II”、“武汉人工智能计算中心”在内的几个华为承建的智算中心项目几乎都是使用华为的Atlas 900 AI集群架构,来实现AI算力供给的。Atlas 900 AI集群架构是由数千颗升腾910 AI处理器构成,其总算力达到256P 1024 PFLOPS FP16。

鹏城云脑

浪潮在智算中心方面也有多年的研究,无论是智算中心运行过程中算力生产、算力聚合、算力调度还是算力释放环节,浪潮都分别有相应的技术和软硬件支撑。南京智能计算中心就是采用了浪潮AI服务器算力机组和寒武纪思元270和思元290智能芯片及加速卡。

南京智能计算中心

作为数据中心行业的重要玩家,腾讯将其在数据中心方面的 探索 应用在了智算中心建设中,像腾讯智慧产业长三角(合肥)智算中心建设中就用到了腾讯第四代T-Block等高端模块化技术,支持项目快速交付。腾讯第四代T-Block等高端模块化技术就是将IT、空调等数据中心的各个功能模块化,以实现按需灵活配置。

商汤 科技 是从2018年开始进行人工智能计算中心预研工作的,2020年7月开始商汤 科技 人工智能计算中心建设工作。2022年1月24日,商汤 科技 人工智能计算中心启动运营。商汤 科技 人工智能计算中心的峰值算力高达3740 Petaflops,这背后包含了商汤 科技 的多种技术突破,包括高性能计算、分布式调度、硬件/软件协同设计等。

商汤 科技 人工智能计算中心

我们通过调查2021年以来建设和建成的智算中心,发现越来越多的城市已经开始了智算中心建设。这体现了各地对于AI产业的重视。从一些现有的智算中心建设工期来看,一般一期建设大概时间在半年到一年不等,今年可能会有更多在建的智算中心建成并投运。另外,“东数西算”工程也会对新的智算中心的规划、建设产生多重影响。

目前参与智算中心建设的企业相对有限,随着各地对智算中心建设需求的增加以及一些新玩家加入,智算中心领域玩家可能会面临更激烈的竞争。

边缘计算(Edge Computing)是一种分布式计算范式,它将计算任务从数据中心迁移到靠近数据源的设备上。这种方法可以减少网络延迟、提高数据处理速度,并在一定程度上保护用户隐私。边缘计算可应用于许多领域,包括但不限于:

物联网(IoT):边缘计算可用于实时处理智能家居、工业自动化、智能交通等领域的大量数据,从而提高响应速度和减少数据传输成本。

无人驾驶:通过在车辆本地进行数据处理和决策,边缘计算可以提高自动驾驶汽车的反应速度,从而提高安全性。

增强现实(AR)和虚拟现实(VR):边缘计算可以减少AR和VR设备在渲染图像和处理数据时的延迟,提高用户体验。

智能城市:边缘计算可以帮助处理城市基础设施中的大量数据,例如交通管理、能源管理和公共安全等。

医疗保健:通过实时分析患者数据,边缘计算可以帮助医生及时发现病情变化,提高诊断和治疗效果。

视频监控:边缘计算可在摄像头端实现实时视频分析,提高安全监控效率并保护用户隐私。

零售业:边缘计算可以帮助零售商实时分析顾客数据、库存数据,优化商店布局和库存管理。

能源管理:边缘计算可以实时监测和优化能源系统,提高能源效率。

农业:通过实时监测和分析土壤、气候等数据,边缘计算可以帮助农民提高农业生产效率。

这些只是边缘计算应用领域的一部分,随着技术的发展,边缘计算将在更多领域发挥作用。

通俗讲解边缘计算
随着物联网越来越火,同时伴随着物联网而来的,就是各种概念和各种技术,其中一个就是边缘计算,当然还有雾计算。其实边缘计算和雾计算都差不多,雾计算只是和云计算是相对的。只是叫边缘计算呢,比较高大上吧。
下面我们要通俗地讲一讲边缘计算。

为什么要通俗的讲呢,怕如果不通俗,你听不明白。新的东西在出来的时候,往往是需要一个接纳和理解的过程。就像以前互联网刚出来的时候,很多人都不知道互联网,于是就得慢慢科普,让大家慢慢接受和理解呀。谁现在还解释什么是互联网呀。

而边缘计算也有一段时间了,只是随着物联网的发展,边缘计算的概念也开始流行起来。我们先看一段非通俗的介绍边缘计算的概念:
边缘计算,是一种分散式运算的架构。在这种架构下,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。

或者说,边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。

边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。
以上是我从网络文章摘抄的一段对于边缘计算的解释。整个解释基本都是专业术语,搞工控的你,看完这段话,你来告诉我什么是边缘计算。

作为一名参与研发产品边缘计算的程序员,我决定写一篇文章来通俗讲解一下这个边缘计算。
首先,我要举一个不太恰当的例子。

比如有一款APP,用户在使用这款APP的时候,就会收集用户的信息,比如收集这个用户的年龄,性别,手机号,地址位置,搜索记录等等信息,而收集这些信息主要是更好地分析这个用户的行为和感兴趣的东西,比如车,房子,书,美食等什么感兴趣。然后更为准确地为其投放内容及广告。

    这个是很常见的一个功能,但是就是这样一个功能,怎么和边缘计算挂钩呢。

在边缘计算之前,就是云计算了。

如果是使用云计算,这款APP的行为是这样的:

    APP收集到信息后,把所有的基本信息,上传到服务器中,然后由服务器来执行算法,计算和识别出用户的兴趣爱好,甚至可能推算出这个用户的消费能力。然后服务器就可以根据这个推算出来的结果,为用户投放其感兴趣的内容和广告。

如果是使用边缘计算,这款APP的行为就是这样:

    APP收集了信息后,不上传到服务器中。然后由APP自己计算和识别出这个用户的兴趣和爱好,也可以推算出这个用户的消费能力,也就是服务器的计算功能,直接由APP来完成。然后服务器只需要问一下APP,哪个用户是有可能是年薪百万的,哪个用户是单身的。APP只需要告诉服务器说,这个一路向东用户很帅,而且还单身,喜欢旅游,写诗,可以为其投放相亲美女内容。

就这样,整个过程并没有服务器参与计算,服务器也没有参与收集信息。因为这个信息在APP本身收集和计算,并没有进行上传,所以也没有涉及信息收集。

而,这就是边缘计算。

也就是以前由服务器作计算的部分,现在改由信息采集的设备直接计算了,再把计算的结果,直接输出到服务器中。服务器只要结果,并不需要过程的数据。
下面我们就以回答问题的形式来通俗的聊一聊这个边缘计算吧。

所以,什么是边缘计算呢。

边缘计算,说白了,就是(服务器)云计算懒得算了,就这点数据,你在数据采集的时候,顺便自己算得了,什么都丢到服务器来算,很累的。于是,边缘计算就这么来了。
那么,工控领域行业中使用到边缘计算的都有哪呢

这个就太多了。随着很多PLC,控制器和触摸屏等都开始接入到物联网中,每个设备需要采集的信息不一样,有温度,湿度,产量,生产数据,运行状态等。而不同行业的参数指标,性能数据都不一样,这很难在服务器通过云计算来形成一套标准,这使得PLC,控制器等,都会用到边缘计算。
为什么以前的DTU,或者物联模块等不流行边缘计算,现在开始流行了呢。

因为现在的IoT使用的模块或者芯片的处理能力也越来越高,资源也比较丰富,随着一些芯片成本的下降,以及开发模式的简化,使得一些芯片或模块在处理基本的数据采集功能后,仍存在资源过剩及功能利用率低的情况,也就是一个100%的芯片或模块,你只使用了10%的来采集数据,那还有90%你可以用来作计算
那么,使用边缘计算的优势在哪里呢。

1 可以使得设备的支持数量提升几个数量级。

   比如一个服务器有10000点血。而接入一个设备,就要消耗1点血,如果再对这个设备进行数据分析,需要消耗9点血。也就是接入并计算一个设备就需要10点血。那么这个服务器最多只能接入1000个设备就挂了。

   如果服务器只负责接入设备,不进行计算和分析,那么接入一个设备,消耗1点血,由设备自己进行数据计算和分析,再输出结果。这时候服务器就可以接入10000个设备了。

  没有使用边缘计算,服务器可以接1000个设备。

  如果使用了边缘计算,服务器可以接10000个设备。提升了一个数量级。而对于一些复杂的设备,特别是一些工厂,现场作业等需要数据量多的,如果使用了边缘计算来给服务器节省空间和资源,这个优势更能体现出来了。

2 让计算变得更为灵活和可控

   前面说到,接入设备的服务器很难做到统一的计算分析标准,因为物联网可是一个万物接入的网络,每一个设备采集的数据不一样。如果使用了边缘计算,就可以单独针对每一个设备进行相应的计算和分析。当然,如果相同的设备或者相同参数的,可以进行复制使用同一套计算标准或算法。如果将计算脚本开放出来给用户,用户就可以自定义去添加自己的计算公式和行为。
边缘计算的模式和拓扑结构是什么样的呢。
比如要在一套数据采集系统里,以一个云服务器为中心,移动客户端,PC客户端或第三方接口等接入到云服务器获取数据,而数据采集方呢,由数据采集模块来连接到云服务中。

    数据采集模块可以采集PLC,变频器,智能仪表等,将数据上传到云服务器中,由服务器进行数据分析和计算,然后PC或移动客户端,第三方接口就可以获取数据分析的结果。但是这种情况下,随着设备的接入越来越多,云服务器的负担也会越来越重,而且接入的PLC,控制器等的种类也越来越多,原来的云服务数据计算模式难以满足越来越复杂的应用。这时候边缘计算就应运而生了。

    在原拓扑结构不变的情况,可无缝引入边缘计算。在数据采集模块端开放边缘计算功能,将复杂的计算,策略,规则等,由数据采集模块进行运算,得到输出结果后,只需要将结果上传到云服务中。再由PC客户端,移动客户端及第三方接口从云服务获取。

    比如数据采集模块需要采集一个电表,电表能采集的数据有电流,电压,偏偏没有功率。当然现在的电表采集不到功率很少了,只是举例。

    那怎么办呢,偏偏客户很想看到功率。那在没有边缘计算的时候,为了要看到功率,只好在云服务里,增加一定的计算规则,将采集到的电流和电压通过计算得到功率。如果有1000个电表,云服务器就要对这1000个电表进行计算。这就增加了云服务器的工作量和负担了。

    如果有了边缘计算,那么在数据采集模块,就可以添加计算功能,直接将采集的电流和电压通过计算得到功率,只需要把功率上传给服务器就可以了。这样,即便有50000个电表,云服务也毫无计算压力,因为它并不需要计算。
    这就是通俗的讲一讲边缘计算。

边缘计算指的是靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台。这些物或数据源头的一侧搭载着融合网络、计算、存储、 应用核心能力的边缘计算平台,为终端用户提供实时、动态和智能的服务计算。

边缘计算是什么?

举个最简单的例子:在焊接机器人焊接两个钢制部件时,焊点如何选择?是偏左一点儿还是偏右一点儿,是偏上一点儿还是偏下一点儿?虽然冲压出来的钢板都是统一标准出来的,但是两个部件结合时难免会有细微差别,通过可视化观察以及边缘计算,机器人可以自己判断最优焊点的位置,将两个部件焊接牢固。每次焊接的数据通过网络上传至云端储存,用以机器学习。如果没有边缘计算,都通过云计算来判断焊点位置,生产效率会降低,同时焊点也可能千篇一律,有些部件可能正好赶上并不是最优的焊点位置,给焊接上了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13017689.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存