NVIDIA发布搭载GPU的ARM服务器参考平台

NVIDIA发布搭载GPU的ARM服务器参考平台,第1张

资讯2019 年 1 1 月 1 8 日, NVIDIA 于今日发布一款参考设计平台,使企业能够快速构建 GPU 加速的 Arm 服务器 , 以满足日益多样化的科学和工业应用需求。 这 开辟 了 高性能计算的新纪元 。  

NVIDIA 创始人兼首席执行官黄仁勋在 2 019 国际超级计算大会( SC19 )上宣布推出这款参考设计平台。该平台由硬件和软件基础模块组成,能够满足高性能计算( HPC )社区对于 类型 更加多样化的 C PU 架构日益增长的需求。通过该平台,超级计算中心、超大型云运营商和企业能够将 NVIDIA 加速计算平台的优势与最新的 Arm 服务器平台相结合。

为了构建 这一参考 平台, NVIDIA 与 Arm 及其生态合作伙伴(包括 Ampere 、富士通 和 Marvell ) 联手,以 确保 NVIDIA   GPU 与 Arm 处理器 之间 的 无缝协作 。 该参考平台还得益于 与 HPE 旗下公司 Cray 和 HPE 这 两家早期采用 Arm 服务器的供应商之间的紧密合作。此外,许多高性能计算软件公司已使用 NVIDIA CUDA-X 库 来构建可在 Arm 服务器上运行 、 并可 通过 GPU 实现的管理和监控工具。

黄仁勋表示:“高性能计算正在崛起。机器学习和 AI 领域的突破正在重新定义科学研究方法 , 并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算, NVIDIA GPU 与 A RM 的组合让创新者们能够为不断增加的新应用创建系统。”

Arm IP 产品部门总裁 Rene Haas 表示:“  Arm 正在与生态合作伙伴一 同努力, 为百万兆级的 Arm 系统级芯片提供前所未有的性能和效率。我们与 NVIDIA 合作,将 CUDA 加速带入 到 Arm 架构当中 , 这对于高性能计算社区来说, 具有 里程碑 式的意义 。为了应对全球最复杂的研究 , 挑战并推动嵌入式系统、汽车和边缘细分市场的进一步发展,高性能计算社区已经在部署 Arm 技术。”

今年早些时候, NVIDIA 宣布 为 A rm 带来 C UDA-X 软件平台 。 NVIDIA 此次发布这一参考平台正是对此前承诺的兑现。   根据这一承诺, NVIDIA 正在提供 其 A rm 兼容软件开发套件 的预览版本。该版本包含 NVIDIA CUDA-X 库和加速计算开发工具。

联合整个高性能计算生态中的合作伙伴

除了 使 自己的软件 兼容 Arm 之外, NVIDIA 还与   GROMACS 、 LAMMPS 、 MILC 、 NAMD 、 Quantum  Espresso 和 Relion 等 领先的 高性能计算 应用开发 商密切 合作 , 为 A RM 提供 GPU 加速 的 应 程序 用。 为了让 Arm 平台上的应用实现 GPU 加速, NVIDIA 及其高性能计算应用生态合作伙伴编译了大量代码。

为了构建 Arm 生态, NVIDIA 与领先的 Linux 发行商 Canonical 、 Red Hat,   Inc 、 SUSE , 以及业内领先的高性能计算基础工具供应商 展开 合作。

几家世界级的超级计算中心已开始测试 GPU 加速 Arm 计算系统,其中包括美国的橡树岭国家实验室和桑迪亚国家实验室、英国布里斯托大学以及日本理化学研究所。

来自生态合作伙伴的支持

“  Ampere 非常高兴能够与 NVIDIA 合作开发 GPU 加速解决方案。该解决方案 将 与高性能、高能效 Ampere 的 服务器处理器实现无缝协作。我们的新产品将使我们的客户能够灵活选择最佳的 NVIDIA GPU 加速,从而高效地运行云、边缘等要求极高的工作负载。”

——   Ampere Computing 董事长兼首席执行官, Renee James

“很高兴看到 NVIDIA 能够如此迅速地为 Arm 服务器带来 CUDA 和 OpenACC 。我们十分希望能够与 NVIDIA 及 其他公司开展密切的合作,在这一架构上编译、分析和调试加速应用。目前,我们已在 4096 核 Arm 系统上证明了这一合作所带来的优势。”

——   EPCC 主任, Mark   Parsons 教授

“对于正在不断发展的 Arm 生态而言, NVIDIA 是一个备受欢迎且重要的生态成员。富士通相信,随着我们迈入新的计算时代, NVIDIA 将扩展 Arm 生态系统 , 并保证客户在高性能计算和数据科学 领域 ,尤其是人工智能领域有更多的选择。”

——   富士通企业执行官兼服务平台业务部副主管, Takeshi  Horie

“通过我们与 NVIDIA 的密切合作,部署 Marvell ThunderX2 服务器的客户现在可以使用全套 NVIDIA GPU 加速软件。这对于 Arm 生态系统的加速计算可用性来说 , 是一座重要的里程碑。我们将 继续 一同 将能效提高到一个新的水平,同时为百万兆级时代的众多超级计算和 AI 应用提供出众的性能。”

—— Marvell Semiconductor, Inc 副总裁兼服务器处理器业务部总经理 Gopal Hegde

“在 HPE 、 Marvell 和 NVIDIA 的帮助下,橡树岭国家实验室( Oak Ridge National Laboratory )成功地完成了所负责的工作,迅速升级了我们的 Arm 测试台系统,整合了性能测试并取得了良好的成果。在短短两周内,我们编译并正确运行了约八个领先级应用 程序 ,三个重要的社区库 , 以及常被用于评估 Arm 高性能计算生态的基准套件。根据早期结 果可以看出,这个由 Arm 主导的加速计算生态 的功能 似乎 和 POWER 以及 x86 环境 差不多 。对于一个 Arm 内的加速计算生态而言,这是一个了不起的开始。”

——橡树岭国家实验室国家计算科学中心科学主任, Jack C Wells

“我们与 NVIDIA 已经合作了很长时间。我们很高兴地看到, N VIDIA 实现了自己的承诺,为 Arm 高性能计算社区带来了领先的 CUDA-X 软件堆栈和生态系统。我们已经开始在通过 NVIDIA GPU 加速的 Arm 系统上评估理化学研究所的代码,我们 认为 它将为日本高性能计算和 AI 融合工作负载带来新一轮的创新。”

——日本理化学研究所所长, Satoshi Matsuoka

“由于 NVIDIA 为 Arm 主机 CPU 提供了新的支持,因此现在可以直接使用 Kokkos 和 LAMMPS 。这一结果达到了我们的期望,并且让我们可以借鉴在带有 x86   CPU 的系统中部署 NVIDIA GPU 的经验。”

——桑迪亚国家实验室主要技术人员, Christian Trott

“  NVIDIA 的 Arm 软件堆栈的确可以直接使用。我们之前就已大量使用 Arm 和 NVIDIA 这两个独立的平台,因此我们非常高兴这两者能够组合在一起。相比于我们之前尝试过的 x86 平台, NVIDIA 为 Arm   提供的 GPU 驱动器性能非常之好。能够在如此短的时间内取得这一成果,的确令人惊叹。”

—— 布里斯托大学高性能计算教授 , Simon McIntosh-Smith

通过新建虚拟机的配置可以大致了解云宏虚拟化平台支持的功能。

在主机界面选择"增加虚拟机"

输入虚拟机名称、选择 *** 作系统类型。

支持丰富的ARM *** 作系统

虚拟机的CPU配置界面,没有虚拟化穿透,因此不支持虚拟化套嵌。

支持VCPU与物理CPU的绑定

选择绑定的物理CPU

虚拟机的内存配置界面

支持内存的NUMA绑定。

虚拟机磁盘配置界面

虚拟机网络配置

光驱配置界面,支持本地镜像,也支持NFS存储镜像

虚拟机配置汇总

虚拟机配置摘要界面

启动虚拟机,可以通过web控制台进行管理。

通过查看虚拟机VNC密码记端口号,可以使用vnc客户端进行虚拟机管理。

也可以在虚拟机配置界面查看或者修改vnc密码。

通过VNC客户端管理虚拟机



VNC界面

主要 *** 作在主机vcapp250上进行

编辑config/zookeeperproperties

编辑config/serverproperties

编辑bin/kafka-run-classsh

将安装目录拷贝到剩余主机的对应目录中

启动zookeeper

启动kafka

广电鲲鹏服务器是广电运通与华为合作,基于华为鲲鹏920处理的ARM架构的服务器,我这这里测试的是GRGBanking 200 (Model RK2280)型号,2U高度,配置两个64核的Kunpeng 920处理器。

区别于Intel和AMD的X86平台,广电鲲鹏服务器使用的 *** 作系统和应用软件都是ARM版本的。

CPU信息如下:

CPU架构显示是aarch64。指令集于X86的也不相同。

安装CentOS Linux release 771908 (AltArch) *** 作系统

在图形化界面信息下识别不了CPU信息:

安装好 *** 作系统之后想跑一下Unixbench跑分。Unixbench是一个类unix系(Unix,BSD,Linux)统下的性能测试工具,一个开源工具,被广泛用于测试linux系统主机的性能。

先看下GCC的版本:

在X86平台下直接执行Run命令就可以进行Unixbench跑分。

但是在ARM平台下进行Unixbench跑分出现报错:

这是由于CPU的架构不同,-march和-mtune不支持native参数,需要进行修改。

修改MakeFile文件,将 -march=armv8-a -mtune=cortex-a53

再次运行Unixbench就可以正常进行编译跑分了。

X86架构与ARM架构的区别:

1、含义不同:

X86使用CISC(Complex Instruction Set Computer,复杂指令集计算机)。

ARM使用RISC(Reduced Instruction Set Computer,精简指令集计算机),ARM英文全称Advanced RISC Machine。

2、产品特点:

X86追求性能最优,缺点是功耗大,不节能(和ARM对比)。

ARM追求低功耗(节能),缺点是采用精简指令集,导致编译器处理复杂,因此性能相对X86差。

3、所用机型不一样:

X86主要是PC机(Intel、AMD),X86服务器。

ARM主要是应用于移动设备(手机、平板电脑等嵌入式领域)。

4、典型代表:X86结构主要是Intel、AMD等PC电脑;ARM主要是移动终端,IBM的Power PC。

1、应用不同:X86主要用于PC领域如笔记本、台式机、小型服务器;ARM主要用于移动领域如手机、平板。

2、功耗不同:X86的功耗比较高比如我们常用的台式机的CPU的TDP可达65W甚至更高;ARM的功耗很低只有个位数。

3、特点不同:ARM构架最大的特点就是体积小、低功耗、低成本和高性能,ARM构架被广泛的应用于嵌入式的系统当中;相比ARM和Power架构,X86在高性能通用处理器方面务无比巨大。

云宏CNware国产虚拟化平台简介:

CNware®是云宏拥有自主知识产权的虚拟化平台,通过对物理资源、虚拟资源、业务资源统一管理,为客户的应用系统提供高性能、高安全、高可靠的计算、存储、网络服务,构建高度可用、按需服务的虚拟数据中心。

广电鲲鹏服务器是广电运通与华为合作,基于华为鲲鹏920处理的ARM架构的服务器,我这里测试的是GRGBanking 200 (Model RK2280)型号,2U高度,配置两个64核的Kunpeng 920处理器。

广电鲲鹏RK2280启动界面,配置两颗HiSilicon Kunpeng 920-7261K 64核CPU,256G内存。

通过光盘启动进入安装界面。

我这里使用的是ARM版的安装镜像,第一项就是支持华为的kunpeng CPU,另外还支持Mavell、Ampere、飞腾的CPU。目前主流的ARM版服务器CPU都可以支持。

进入安装界面,浓郁的Centos味道。

配置安装界面

选择安装磁盘

选择安装计算节点还是管理节点,另外可以安装分布式存储组件。

设置root密码。

完成安装,点击重启

启动界面,前面两个是云宏的虚拟化 *** 作系统,后面两个是之前测试UOS的残余,可以忽略。

完成启动进入登陆界面。

系统信息:

可以看出这是基于Centos+KVM的解决方案。​


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10694778.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-10
下一篇 2023-05-10

发表评论

登录后才能评论

评论列表(0条)

保存