在2020 年,浪潮AI服务器推出了哪些新产品?

在2020 年,浪潮AI服务器推出了哪些新产品?,第1张

众所周知,浪潮作为全球领先的AI算力提供商厂商,其打造的浪潮AI服务器在中国AI基础架构设施领域已连续三年保持50%以上市场份额。在2020年,浪潮主要推出了5款AI服务器产品,分别是浪潮AI服务器NF5488M5-D、浪潮AI服务器NF5488A5、浪潮AI服务器NF5488M6、浪潮AI服务器NF5688M6和浪潮AI服务器NF5888M6。全面支持全新NVIDIA® Ampere架构。全新服务器全面支持全新NVIDIA® Ampere架构,可支持8到16颗NVIDIA A100 Tensor Core GPU,能够提供高达每秒4亿亿次的AI计算性能, 以及高达600GB/S 的GPU间P2P带宽,能够应对多种人工智能计算场景。

AI服务器一般以加速卡类型区分,常见的计算卡有CPU、GPU、FPGA、TPU、ASIC五种,如果单从性能上看,这五种卡是依次提升,CPU最弱,ASIC最强。
但是在实际的应用中,不仅仅要考虑性能,还需要顾及AI服务器的可编程性和灵活性,而在这方面,从CPU到ASIC则是依次递减,ASIC是将算法固化在芯片上,算法是比较固定的,所以它的性能最好,但是编程性和灵活性就明显受限。
参考链接:>

当前,为推进IT支撑系统集约化建设和运营,进一步发挥集中化能力优势,IT云成为运营商IT支撑系统建设的基础架构。但在IT云资源池部署过程中,服务器技术面临多个新挑战,主要体现在以下3个方面。


在性能方面,人工智能(AI)应用快速扩张,要求IT云采用高性能GPU服务器。AI已在电信业网络覆盖优化、批量投诉定界、异常检测/诊断、业务识别、用户定位等场景规模化应用。AI应用需求的大量出现,要求数据中心部署的服务器具有更好的计算效能、吞吐能力和延迟性能,以传统通用x86服务器为核心的计算平台显得力不从心,GPU服务器因此登上运营商IT建设的历史舞台。


在效率成本方面,IT云部署通用服务器存在弊端,催生定制化整机柜服务器应用需求。在IT云建设过程中,由于业务需求增长快速,IT云资源池扩容压力较大,云资源池中的服务器数量快速递增,上线效率亟需提高。同时,传统通用服务器部署模式周期长、部署密度低的劣势,给数据中心空间、电力、建设成本和高效维护管理都带来了较大的挑战。整机柜服务器成为IT云建设的另一可选方案。


在节能方面,AI等高密度应用场景的快速发展,驱动液冷服务器成为热点。随着AI高密度业务应用的发展,未来数据中心服务器功率将从3kW~5kW向20kW甚至100kW以上规模发展,传统的风冷式服务器制冷系统解决方案已经无法满足制冷需求,液冷服务器成为AI应用场景下的有效解决方案。


GPU服务器技术发展态势及在电信业的应用


GPU服务器技术发展态势


GPU服务器是单指令、多数据处理架构,通过与CPU协同进行工作。从CPU和GPU之间的互联架构进行划分,GPU服务器又可分为基于传统PCIe架构的GPU服务器和基于NVLink架构的GPU服务器两类。GPU服务器具有通用性强、生态系统完善的显著优势,因此牢牢占据了AI基础架构市场的主导地位,国内外主流厂商均推出不同规格的GPU服务器。


GPU服务器在运营商IT云建设中的应用


当前,电信业开始推动GPU服务器在IT云资源池中的应用,省公司现网中已经部署了部分GPU服务器。同时,考虑到GPU成本较高,集团公司层面通过建设统一AI平台,集中化部署一批GPU服务器,形成AI资源优化配置。从技术选型来看,目前运营商IT云资源池采用英伟达、英特尔等厂商相关产品居多。


GPU服务器在IT云应用中取得了良好的效果。在现网部署的GPU服务器中,与训练和推理相关的深度学习应用占主要部分,占比超过70%,支撑的业务包括网络覆盖智能优化、用户智能定位、智能营销、智能稽核等,这些智能应用减少了人工投入成本,提升了工作效率。以智能稽核为例,以往无纸化业务单据的人工稽核平均耗时约48秒/单,而AI稽核平均耗时仅约5秒/单,稽核效率提升达 90%。同时,无纸化业务单据人工稽核成本约15元/单,采用GPU进行AI稽核成本约0048元/单,稽核成本降低达968%。


整机柜服务器发展态势及在电信业的应用


整机柜服务器技术发展态势


整机柜服务器是按照模块化设计思路打造的服务器解决方案,系统架构由机柜、网络、供电、服务器节点、集中散热、集中管理6个子系统组成,是对数据中心服务器设计技术的一次根本性变革。整机柜服务器将供电单元、散热单元池化,通过节约空间来提高部署密度,其部署密度通常可以翻倍。集中供电和散热的设计,使整机柜服务器仅需配置传统机柜式服务器10%的电源数量就可满足供电需要,电源效率可以提升10%以上,且单台服务器的能耗可降低5%。


整机柜服务器在运营商IT云建设中的应用


国内运营商在IT云建设中已经推进了整机柜服务器部署,经过实际应用检验,在如下方面优势明显。


一是工厂预制,交付工时大幅缩短。传统服务器交付效率低,采用整机柜服务器将原来在数据中心现场进行的服务器拆包、上架、布线等工作转移到工厂完成,部署的颗粒度从1台上升到几十台,交付效率大大提升。以一次性交付1500台服务器为例,交付工作量可减少170~210人天,按每天配10人计算,现场交付时间可节省约17~21天。


二是资源池化带来部件数量降低,故障率大幅下降。整机柜服务器通过将供电、制冷等部件资源池化,大幅减少了部件数量,带来故障率的大幅降低。图1比较了32节点整机柜服务器与传统1U、2U服务器机型各自的电源部件数量及在一年内的月度故障率情况。由于32节点整机柜服务器含10个电源部件,而32台1U通用服务器的电源部件为64个,相较而言,整机柜电源部件数减少844%。由于电源部件数量的降低,32节点整机柜服务器相对于32台1U通用服务器的月度故障率也大幅缩减。



三是运维效率提升60%以上。整机柜服务器在工厂预制机柜布线,网络线缆在工厂经过预处理,线缆长度精确匹配,理线简洁,接线方式统一规范,配合运维标签,在运维中可以更方便简洁地对节点实施维护 *** 作,有效降低运维误 *** 作,提升运维效率60%以上,并大幅减少发生故障后的故障恢复时间。


液冷服务器技术发展态势及在电信业的应用


液冷服务器技术发展态势


液冷服务器技术也称为服务器芯片液体冷却技术,采用特种或经特殊处理的液体,直接或近距离间接换热冷却芯片或者IT整体设备,具体包括冷板式冷却、浸没式冷却和喷淋式冷却3种形态。液冷服务器可以针对CPU热岛精确定点冷却,精确控制制冷分配,能真正将高密度部署带到前所未有的更高层级(例如20kW~100kW高密度数据中心),是数据中心节能技术的发展方向之一,3种液冷技术对比如表1所示。




液冷服务器在运营商IT建设中的应用


液冷服务器技术目前在我国仍处于应用初期,产业链尚不完备、设备采购成本偏高、采购渠道少、电子元器件的兼容性低、液冷服务器专用冷却液成本高等问题是液冷服务器尚未大规模推广的重要原因。从液冷服务器在运营商数据中心领域的具体应用案例来看,运营商在IT云资源池规划和建设过程中,通常会对液冷服务器的发展现状、技术成熟度等进行分析论证。


考虑到目前液冷服务器规模化应用尚处于起步阶段,需要3~5年的引入期,因此暂时未在IT云资源池建设中进行大规模落地部署,但在部分地区有小规模应用,如中国移动南方基地数据中心已经开展液冷服务器试点应用,中国联通研究院也在开展边缘数据中心服务器喷淋式液冷系统的开发。未来,随着IT云建设规模、建设密度的继续攀升,以及液冷产业生态体系的逐步成熟,液冷服务器在IT云建设中将有更大的应用空间。


总体来看,运营商IT云资源池建设对服务器计算性能、延迟、吞吐、制冷、定制化、分布式部署等方面都提出了更高要求。未来,GPU服务器、定制化整机柜服务器、液冷服务器等新兴服务器技术将快速迭代,为运营商数据中心服务器技术的发展和演进带来新的思路和路径。

浪潮AI服务器还是很不错的。首先,浪潮AI服务器坚持自主研发,并以提升AI计算性能为主要方向,为用户提供领先的AI算力和成熟的生态支持。然后,浪潮AI服务器具有丰富的产品线,适用于智能客服、金融分析、智慧城市等各种AI应用场景。另外,浪潮AI服务器的推理和测试性能也十分强劲。比如,浪潮AI服务器NF5488A5在MLPerf全球AI基准性能测试中一举创下18项世界纪录,其中在ResNet50推理任务测试中,实现了549万/每秒的全球服务器最好成绩,相比2019年单服务器纪录提升3倍。

浪潮AI服务器在中国的市场份额已逐渐加大,
浪潮AI服务器专注于高性能计算领域服务与产品解决方案,为有高算力需求的科研用户搭建高效的计算环境。
浪潮在AI服务器领域拥有丰富的经验与优厚的发展成果,早在2010年就提前布局互联网行业,同样是在看似十分恶劣的市场环境中,浪潮依然锁定了互联网市场作为战略方向,如今互联网巨头们与浪潮已形成了紧密的合作伙伴关系,推动了一个又一个AI应用在市场的落地。如今浪潮拥有国内领先的GPU硬件软件移植优化团队的公司。在产品层面,浪潮的Cafe成功实现了全球第一个并行版本集成版本的UPI,并且实现了全球最好的扩展性能,浪潮AI资源平台AIStation也已经成为中国AI客户里应用广泛的AI资源调度平台。2020年对各行各业而言都是一个特殊的年份,但在普通民众生活遭受重创的同时,AI技术和应用仍在加速脚步,成为帮助我们快速走出疫情的助力,这其中起着重要支撑作用的就是计算力。浪潮AI浪潮信息副总裁、浪潮AI&HPC总经理刘军也简明扼要地指出,在全新的智慧时代最重要的生产力就是计算力。瞄准计算力后,这一年,浪潮基于AI芯片、AI服务器、高速互联、深度学习的框架,来构建整个智算中心,从而实现了生产算力、聚合算力,调度算力、释放算力,从而形成一个算力生产供应的平台,数据开发共享的平台,智能生态的建设平台和产业创新的平台,为自身的2020年发展交上了一份满意的答卷。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10663171.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-10
下一篇 2023-05-10

发表评论

登录后才能评论

评论列表(0条)

保存