NVIDIA发布搭载GPU的ARM服务器参考平台_服务器

资讯2019 年 1 1 月 1 8 日， NVIDIA 于今日发布一款参考设计平台，使企业能够快速构建 GPU 加速的 Arm 服务器 ，以满足日益多样化的科学和工业应用需求。这开辟了 高性能计算的新纪元。

NVIDIA 创始人兼首席执行官黄仁勋在 2 019 国际超级计算大会（ SC19 ）上宣布推出这款参考设计平台。该平台由硬件和软件基础模块组成，能够满足高性能计算（ HPC ）社区对于类型更加多样化的 C PU 架构日益增长的需求。通过该平台，超级计算中心、超大型云运营商和企业能够将 NVIDIA 加速计算平台的优势与最新的 Arm 服务器平台相结合。

为了构建这一参考平台， NVIDIA 与 Arm 及其生态合作伙伴（包括 Ampere 、富士通和 Marvell ）联手，以确保 NVIDIA GPU 与 Arm 处理器之间的无缝协作。该参考平台还得益于与 HPE 旗下公司 Cray 和 HPE 这两家早期采用 Arm 服务器的供应商之间的紧密合作。此外，许多高性能计算软件公司已使用 NVIDIA CUDA-X 库来构建可在 Arm 服务器上运行、并可通过 GPU 实现的管理和监控工具。

黄仁勋表示：“高性能计算正在崛起。机器学习和 AI 领域的突破正在重新定义科学研究方法，并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算， NVIDIA GPU 与 A RM 的组合让创新者们能够为不断增加的新应用创建系统。”

Arm IP 产品部门总裁 Rene Haas 表示：“ Arm 正在与生态合作伙伴一同努力，为百万兆级的 Arm 系统级芯片提供前所未有的性能和效率。我们与 NVIDIA 合作，将 CUDA 加速带入到 Arm 架构当中，这对于高性能计算社区来说，具有里程碑式的意义。为了应对全球最复杂的研究，挑战并推动嵌入式系统、汽车和边缘细分市场的进一步发展，高性能计算社区已经在部署 Arm 技术。”

今年早些时候， NVIDIA 宣布为 A rm 带来 C UDA-X 软件平台。 NVIDIA 此次发布这一参考平台正是对此前承诺的兑现。根据这一承诺， NVIDIA 正在提供其 A rm 兼容软件开发套件的预览版本。该版本包含 NVIDIA CUDA-X 库和加速计算开发工具。

联合整个高性能计算生态中的合作伙伴

除了使自己的软件兼容 Arm 之外， NVIDIA 还与 GROMACS 、 LAMMPS 、 MILC 、 NAMD 、 Quantum Espresso 和 Relion 等领先的高性能计算应用开发商密切合作，为 A RM 提供 GPU 加速的应程序用。为了让 Arm 平台上的应用实现 GPU 加速， NVIDIA 及其高性能计算应用生态合作伙伴编译了大量代码。

为了构建 Arm 生态， NVIDIA 与领先的 Linux 发行商 Canonical 、 Red Hat, Inc 、 SUSE ，以及业内领先的高性能计算基础工具供应商展开合作。

几家世界级的超级计算中心已开始测试 GPU 加速 Arm 计算系统，其中包括美国的橡树岭国家实验室和桑迪亚国家实验室、英国布里斯托大学以及日本理化学研究所。

来自生态合作伙伴的支持

“ Ampere 非常高兴能够与 NVIDIA 合作开发 GPU 加速解决方案。该解决方案将与高性能、高能效 Ampere 的服务器处理器实现无缝协作。我们的新产品将使我们的客户能够灵活选择最佳的 NVIDIA GPU 加速，从而高效地运行云、边缘等要求极高的工作负载。”

—— Ampere Computing 董事长兼首席执行官， Renee James

“很高兴看到 NVIDIA 能够如此迅速地为 Arm 服务器带来 CUDA 和 OpenACC 。我们十分希望能够与 NVIDIA 及其他公司开展密切的合作，在这一架构上编译、分析和调试加速应用。目前，我们已在 4096 核 Arm 系统上证明了这一合作所带来的优势。”

—— EPCC 主任， Mark Parsons 教授

“对于正在不断发展的 Arm 生态而言， NVIDIA 是一个备受欢迎且重要的生态成员。富士通相信，随着我们迈入新的计算时代， NVIDIA 将扩展 Arm 生态系统，并保证客户在高性能计算和数据科学领域，尤其是人工智能领域有更多的选择。”

—— 富士通企业执行官兼服务平台业务部副主管， Takeshi Horie

“通过我们与 NVIDIA 的密切合作，部署 Marvell ThunderX2 服务器的客户现在可以使用全套 NVIDIA GPU 加速软件。这对于 Arm 生态系统的加速计算可用性来说，是一座重要的里程碑。我们将继续一同将能效提高到一个新的水平，同时为百万兆级时代的众多超级计算和 AI 应用提供出众的性能。”

—— Marvell Semiconductor, Inc 副总裁兼服务器处理器业务部总经理 Gopal Hegde

“在 HPE 、 Marvell 和 NVIDIA 的帮助下，橡树岭国家实验室（ Oak Ridge National Laboratory ）成功地完成了所负责的工作，迅速升级了我们的 Arm 测试台系统，整合了性能测试并取得了良好的成果。在短短两周内，我们编译并正确运行了约八个领先级应用程序，三个重要的社区库，以及常被用于评估 Arm 高性能计算生态的基准套件。根据早期结果可以看出，这个由 Arm 主导的加速计算生态的功能似乎和 POWER 以及 x86 环境差不多。对于一个 Arm 内的加速计算生态而言，这是一个了不起的开始。”

——橡树岭国家实验室国家计算科学中心科学主任， Jack C Wells

“我们与 NVIDIA 已经合作了很长时间。我们很高兴地看到， N VIDIA 实现了自己的承诺，为 Arm 高性能计算社区带来了领先的 CUDA-X 软件堆栈和生态系统。我们已经开始在通过 NVIDIA GPU 加速的 Arm 系统上评估理化学研究所的代码，我们认为它将为日本高性能计算和 AI 融合工作负载带来新一轮的创新。”

——日本理化学研究所所长， Satoshi Matsuoka

“由于 NVIDIA 为 Arm 主机 CPU 提供了新的支持，因此现在可以直接使用 Kokkos 和 LAMMPS 。这一结果达到了我们的期望，并且让我们可以借鉴在带有 x86 CPU 的系统中部署 NVIDIA GPU 的经验。”

——桑迪亚国家实验室主要技术人员， Christian Trott

“ NVIDIA 的 Arm 软件堆栈的确可以直接使用。我们之前就已大量使用 Arm 和 NVIDIA 这两个独立的平台，因此我们非常高兴这两者能够组合在一起。相比于我们之前尝试过的 x86 平台， NVIDIA 为 Arm 提供的 GPU 驱动器性能非常之好。能够在如此短的时间内取得这一成果，的确令人惊叹。”

—— 布里斯托大学高性能计算教授， Simon McIntosh-Smith

通过新建虚拟机的配置可以大致了解云宏虚拟化平台支持的功能。

在主机界面选择"增加虚拟机"

输入虚拟机名称、选择 *** 作系统类型。

支持丰富的ARM *** 作系统

虚拟机的CPU配置界面，没有虚拟化穿透，因此不支持虚拟化套嵌。

支持VCPU与物理CPU的绑定

选择绑定的物理CPU

虚拟机的内存配置界面

支持内存的NUMA绑定。

虚拟机磁盘配置界面

虚拟机网络配置

光驱配置界面，支持本地镜像，也支持NFS存储镜像

虚拟机配置汇总

虚拟机配置摘要界面

启动虚拟机，可以通过web控制台进行管理。

通过查看虚拟机VNC密码记端口号，可以使用vnc客户端进行虚拟机管理。

也可以在虚拟机配置界面查看或者修改vnc密码。

通过VNC客户端管理虚拟机

VNC界面

主要 *** 作在主机vcapp250上进行

编辑config/zookeeperproperties

编辑config/serverproperties

编辑bin/kafka-run-classsh

将安装目录拷贝到剩余主机的对应目录中

启动zookeeper

启动kafka

广电鲲鹏服务器是广电运通与华为合作，基于华为鲲鹏920处理的ARM架构的服务器，我这这里测试的是GRGBanking 200 (Model RK2280)型号，2U高度，配置两个64核的Kunpeng 920处理器。

区别于Intel和AMD的X86平台，广电鲲鹏服务器使用的 *** 作系统和应用软件都是ARM版本的。

CPU信息如下：

CPU架构显示是aarch64。指令集于X86的也不相同。

安装CentOS Linux release 771908 (AltArch) *** 作系统

在图形化界面信息下识别不了CPU信息：

安装好 *** 作系统之后想跑一下Unixbench跑分。Unixbench是一个类unix系（Unix，BSD，Linux）统下的性能测试工具，一个开源工具，被广泛用于测试linux系统主机的性能。

先看下GCC的版本：

在X86平台下直接执行Run命令就可以进行Unixbench跑分。

但是在ARM平台下进行Unixbench跑分出现报错：

这是由于CPU的架构不同，-march和-mtune不支持native参数，需要进行修改。

修改MakeFile文件，将 -march=armv8-a -mtune=cortex-a53

再次运行Unixbench就可以正常进行编译跑分了。

X86架构与ARM架构的区别：

1、含义不同：

X86使用CISC（Complex Instruction Set Computer，复杂指令集计算机）。

ARM使用RISC（Reduced Instruction Set Computer，精简指令集计算机），ARM英文全称Advanced RISC Machine。

2、产品特点：

X86追求性能最优，缺点是功耗大，不节能（和ARM对比）。

ARM追求低功耗（节能）,缺点是采用精简指令集，导致编译器处理复杂，因此性能相对X86差。

3、所用机型不一样：

X86主要是PC机（Intel、AMD），X86服务器。

ARM主要是应用于移动设备（手机、平板电脑等嵌入式领域）。

4、典型代表：X86结构主要是Intel、AMD等PC电脑；ARM主要是移动终端，IBM的Power PC。

1、应用不同：X86主要用于PC领域如笔记本、台式机、小型服务器；ARM主要用于移动领域如手机、平板。

2、功耗不同：X86的功耗比较高比如我们常用的台式机的CPU的TDP可达65W甚至更高；ARM的功耗很低只有个位数。

3、特点不同：ARM构架最大的特点就是体积小、低功耗、低成本和高性能，ARM构架被广泛的应用于嵌入式的系统当中；相比ARM和Power架构，X86在高性能通用处理器方面务无比巨大。

云宏CNware国产虚拟化平台简介：

CNware®是云宏拥有自主知识产权的虚拟化平台，通过对物理资源、虚拟资源、业务资源统一管理，为客户的应用系统提供高性能、高安全、高可靠的计算、存储、网络服务，构建高度可用、按需服务的虚拟数据中心。

广电鲲鹏服务器是广电运通与华为合作，基于华为鲲鹏920处理的ARM架构的服务器，我这里测试的是GRGBanking 200 (Model RK2280)型号，2U高度，配置两个64核的Kunpeng 920处理器。

广电鲲鹏RK2280启动界面，配置两颗HiSilicon Kunpeng 920-7261K 64核CPU，256G内存。

通过光盘启动进入安装界面。

我这里使用的是ARM版的安装镜像，第一项就是支持华为的kunpeng CPU，另外还支持Mavell、Ampere、飞腾的CPU。目前主流的ARM版服务器CPU都可以支持。

进入安装界面，浓郁的Centos味道。

配置安装界面

选择安装磁盘

选择安装计算节点还是管理节点，另外可以安装分布式存储组件。

设置root密码。

完成安装，点击重启

启动界面，前面两个是云宏的虚拟化 *** 作系统，后面两个是之前测试UOS的残余，可以忽略。

完成启动进入登陆界面。

系统信息：

可以看出这是基于Centos+KVM的解决方案。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/10694778.html

NVIDIA发布搭载GPU的ARM服务器参考平台

发表评论

评论列表（0条）