推荐一款适合深度学习AI场景应用性能较好的服务器_服务器

深度学习是机器学习的分支，是一种以人工神经网络为架构，对数据进行表征学习的算法。深度学习在搜索技术，数据挖掘，机器学习，机器翻译，自然语言处理等多个领域都取得了卓越的成果，可见其重要性

熟悉深度学习的人都知道，深度学习是需要训练的，所谓的训练就是在成千上万个变量中寻找最佳值的计算。这需要通过不断的尝试识别，而最终获得的数值并非是人工确定的数字，而是一种常态的公式。通过这种像素级的学习，不断总结规律，计算机就可以实现像人一样思考。因而，更擅长并行计算和高带宽的GPU，则成了大家关注的重点。

很多人认为深度学习GPU服务器配置跟普通服务器有些不一样，就像很多人认为做设计的机器一定很贵一样。其实只要显卡或者CPU满足深度学习的应用程序就可以进行深度学习。由于现在CPU的核心数量和架构相对于深度学习来说效率会比GPU低很多，所以大部分深度学习的服务器都是通过高端显卡来运算的。

这里谈谈关于深度学习GPU服务器如何选择，深度学习服务器的一些选购原则和建议：

1、电源：品质有保障，功率要足够，有30~40%冗余

稳定、稳定、还是稳定。一个好的电源能够保证主机再长时间运行不宕机和重启。可以想象一下，计算过程中突然重启，那么又要重来，除了降低效率，还影响心情。有些电源低负载使用的时候可能不出问题，一旦高负载运行的时候就容易出问题。选择电源的时候一定要选择功率有冗余品质过硬，不要功率刚刚好超出一点。

2、显卡：目前主流RTX3090,最新RTX4090也将上市

显卡在深度学习中起到很重要的作用，也是预算的一大头。预算有限，可以选择RTX3080 /RTX3090/RTX4090(上月刚发布，本月12日上市)。预算充足，可以选择专业深度学习卡Titan RTX/Tesla V100 /A6000/A100/H100（处于断供中）等等。

3、CPU：两家独大，在这要讲的是PC级和服务器级别处理器的定位

Intel的处理器至强Xeon、酷睿Core、赛扬Celeron、奔腾Pentium和凌动Atom5个系列，而至强是用于服务器端，目前市场上最常见的是酷睿。当下是第三代Xeon Scalable系列处理器，分为Platinum白金、Gold金牌、 Silver 银牌。

AMD处理器分为锐龙Ryzen、锐龙Ryzen Pro、锐龙线程撕裂者Ryzen Threadripper、霄龙EPYC，其中霄龙是服务器端的CPU，最常见的是锐龙。当下是第三代 EPYC（霄龙）处理器，AMD 第三代 EPYC 7003 系列最高 64核。

选择单路还是双路也是看软件，纯粹的使用GPU运算，其实CPU没有多大负载。考虑到更多的用途，当然CPU不能太差。主流的高性能多核多线程CPU即可。

4、内存：单根16G/32G/64G 可选，服务器级别内存有ECC功能，PC级内存没有，非常重要

内存32G起步，内存都是可以扩展的，所以够用就好，不够以后可以再加，买多了是浪费。

5、硬盘：固态硬盘和机械硬盘，通常系统盘追求速度用固态硬盘，数据盘强调存储量用机械盘

固态选择大品牌企业级，Nvme或者SATA协议区别不大，杂牌固态就不要考虑了，用着用着突然掉盘就不好了。

6、机箱平台：服务器级别建议选择超微主板平台，稳定性、可靠性是第一要求

预留足够的空间方便升级，比如现在使用单显卡，未来可能要加显卡等等；结构要合理，合理的空间更利于空气流动。最好是加几个散热效果好的机箱风扇辅助散热。温度也是导致不稳定的一个因素。

7、软硬件支持/解决方案：要有

应用方向：深度学习、量化计算、分子动力学、生物信息学、雷达信号处理、地震数据处理、光学自适应、转码解码、医学成像、图像处理、密码破解、数值分析、计算流体力学、计算机辅助设计等多个科研领域。

软件： Caffe, TensorFlow, Abinit, Amber, Gromacs, Lammps, NAMD, VMD, Materials Studio, Wien2K, Gaussian, Vasp, CFX, OpenFOAM, Abaqus, Ansys, LS-DYNA, Maple, Matlab, Blast, FFTW, Nastran等软件的安装、调试、优化、培训、维护等技术支持和服务。

————————————————

原文链接：>

深度学习GPU服务器是科学计算服务器的一种，科学计算服务器主要用于科学研究，是高性能计算机的一种，介于一般服务器与超级计算机之间。目前，科学计算服务器大约占整个服务器市场的5%左右，风虎云龙是目前所知国内专注于科学计算高性能服务器的厂商品牌，多年来一直紧跟科学发展，密切关注人工智能、机器学习、深度学习发展，结合科研发展需要研发生产高性能科学计算服务器，提供专业的售前、售中和售后服务，以及高性能计算集群的安装、调试、优化、培训、维护等技术支持和服务。

上海风虎信息作为深度学习服务器的专业厂商，专注为科研院所和高校师生打造高性能服务器，建议您选择深度学习服务器时需要注意以下几点：

1深度学习需要大量的并行计算资源，而且动辄计算几天甚至数周，而英伟达NVIDIA、英特尔Intel、AMD显卡（GPU)恰好适合这种工作，提供几十上百倍的加速，性能强劲的GPU能在几个小时内完成原本CPU需要数月完成的任务，所以目前深度学习乃至于机器学习领域已经全面转向GPU架构，使用GPU完成训练任务。

2如今即使使用GPU的深度学习服务器也要持续数天乃至数月（取决于数据规模和深度学习网络模型），需要使用单独的设备保障,保证训练任务能够小时长期稳定运行。

3独立的深度学习工作站（服务器）可以方便实现实验室计算资源共享，多用户可以在个人电脑编写程序，远程访问到深度学习服务器上排队使用计算资源，减少购买设备的开支并且避免了在本地计算机配置复杂的软件环境。

上海风虎信息专注于深度学习GPU服务器开发，根据TensorFlow，Pytorch，Caffe，Keras，Theano等软件计算特征，向您推荐入门级、中级、顶级GPU服务器典型配置，欢迎查阅，谢谢。

拥有高性能计算领域优秀的专业工程师团队，具有 10 年以上高性能计算行业技术支持经验，提供专业的售前、售中和售后服务，以及高性能计算集群的安装、调试、优化、培训、维护等技术支持和服务。在深度学习、量化计算、分子动力学、生物信息学、雷达信号处理、地震数据处理、光学自适应、转码解码、医学成像、图像处理、密码破解、数值分析、计算流体力学、计算机辅助设计等多个科研领域积累了深厚的技术功底，和熟练的技术支持能力。提供 Caffe, TensorFlow, Abinit, Amber, Gromacs, Lammps, NAMD, VMD, Materials Studio, Wien2K, Gaussian, Vasp, CFX, OpenFOAM, Abaqus, Ansys, LS-DYNA, Maple, Matlab, Blast, FFTW, Nastran 等软件的安装、调试、优化、培训、维护等技术支持和服务。

在Linux机器上装ABINIT之前，需确保已经安装了Fortran编译器（g95、pgi或ifc版本的均可），fftw、blas和lapack数学库。到目前为止ABINIT最新成熟版本是464。可以从如下的网址下载到： >专门解答量子力学的软件有：vasp、CASTEP、MS、elk、ASW、abinit、Quantum-ESPRESSO、flapw
vasp由于优化算法比较好，计算速度较快，计算时问题出现较少，需要控制的参数也不是很多。而且他还有比较独特的paw势，在dft平面波的软件中，日渐趋于主流软件。其功能也在逐渐完善。发展潜力很大。
abinit计算软件，我感觉其功能还是很强大的（可以说其它第一性原理软件能计算的性质，它基本都没问题，而且它的gw和dfpt独特功能），计算速度也不是很慢。只是用起来太麻烦，控制参数繁多，入门很慢。
至于再具体的，很多时候就得具体的问题，具体分析了。
MS中包括Visualizer、CASTEP、Dmol3、VAMP、 Discover、 Amorphous Cell、Compass等多个建模和计算软件，可进行晶体、非晶电子结构的量子力学计算，也可进行分子的量子力学计算；可进行材料的分子动力学计算；可进行x-ray衍射计算；能够处理稀土元素，功能强大，就是贵。有Linux和Windows版本，便于学习。 VASP 具有很好的赝势，与CASTEP相似，使用平面波基组。 Wien2k是全电子计算的量子化学软件，处理磁性材料较好。abinit、 Siesta是免费软件，提供原代码。处理重金属不准，缺乏相应的赝势。用于计算晶体的电子结构。 Gaussian主要用于分子、离子的计算，可处理激发态，精度高，耗资源。
flapw中强烈推荐elk，主要优点：代码清晰，容易了解计算原理。后处理极为简单，像画能带图时，会自动给出高对称点，使用自带的elkband可以很容易得到能带图而不用复杂的后处理过程。同时可以处理的性质比较多。
缺点：文档太少。只有一个输入说明，不适合新手。不过官方论坛提问作者一般都会回答。再就是为方便后处理，输出文件比较多，使用前最好看下给的相关例子。再就是目前不支持mpi（可以用openmp并行），对声子不能用dfpt。
缀加球面波方法-ASW
这个软件是在量子化学网上看到的，之前一直都在使用abinit，但是苦于我要计算的体系所含元素的赝势不全，所以就尝试使用ASW。但是目前至少在小木虫上发现使用此软件的人极少。ASW程序的执行文件需要通过邮件向volker Eyert申请。
我总结ASW的特点：计算速度快；输入文件只有一个而且相对简单；磁性计算比较全面：包括无磁、铁磁、反铁磁。当然个人认为它最大的一个优点就是作者编写了很多计算和后期作图的脚本，使用很方便，特别是处理分波态密度时相当轻松。另外目前也发现了一些问题：个人感觉ASW对计算体系的结构尤其是对称性方面有很严格的限制，并不像VASP或是ABINIT那样相对宽松，还有就是它的优化功能不是很全面，可能是我使用的还不是很熟练地原因。
abinit、MS的功能非常强大。第一性原理能计算的性能方法，基本都可以计算。但相对与VASP来说，精度方面可能需要加强。VASP计算可以结合其它的程序计算更多的性能。如结合phonopy算声子普。结合ATAT计算激发态的一些性能。
现在常用的第一性原理计算软件中最容易上手的就是MS，虽然它有很多缺点，比如说赝势不好，精度不高，源代码不开放等等，但是对于一般的科研工作而言就够用了，毕竟我们做计算的目的是寻求规律，解释现象，探求本质，而不是一味追求高精度。精度再高也是理想状态，也无法实现复杂实验条件的模拟。至于文章中图谱的效果、好看与否，更大程度上在于个人对于数据的理解程度、后续分析及数据处理，而不是软件本身了。从这个角度讲，ms则是一款比较实用的软件，把时间和精力用于软件的开发和学习还不如用来加深理论功底和数据分析！一点拙见而已。
使用Quantum-ESPRESSO中，与Abinit一样，都是开源的多功能第一性原理计算包，同样支持GW的计算，并且带有SISSA自主研发的TDDFPT，虽然现在发布的还是有很多功能限制和缺陷。另外，声子计算方面，比Abinit要简便，可以直接像给出k点一样给出q网格。事实上，DFPT方法的发明者就是Quantum-ESPRESSO的作者。另外，QE与其他一些软件包都有接口，可以协调工作，比如万尼尔方程。
计算速度也比较快，计算参数设置灵活但是不复杂，并且邮件列表里人不少，编译时也非常简单，基本不用自己设置什么参数。最大的问题就是赝势库过分不完整，很多时候只能靠着转换别的软件的赝势，或者自己生成赝势，这对不了解理论或者赝势的新手非常致命。另外不同的功能分散在不同的可执行文件中，刚开始入门时可能容易犯晕~
flapw中的wien2k也是很不错的。优点主要在于：
1、有图形界面，上手相对容易，输入和后续处理都有比较好的脚本处理，都很方便。
2、手册对各个参数介绍很全，还有mailinglist可以查询和讨论。
3、对很多物理性质直接模拟，比如光学性质，谱，声子谱等。
4、软件价格很便宜，好像是$400，可以在大型服务器上并行，处理上百个原子是没有问题的，当然计算量相对赝势程序要大。
5、常用的各种交换关联势都已经集成，GW方法已经集成只是还没有释放。
Quantum-ESPRESSO, 个人认为对初学者最大的障碍是没有好的manual 如果以前没有用过其他的第一性原理软件对于参数的设置就比较难以理解不过, 确实如souledge 所说邮件列表非常活跃, 问了几次问题都能有人热心的解答实在不行了跟软件的作者联系, 会学到很多东西
个人比较看好 Quantum-ESPRESSO, 作为开源软件最大的优势就是能吸纳最新的研究成果, 并且自己有更大的主动权

QE和abinit等计算软件首先需要一个linux系统，这里选择ubuntu作为计算平台，安装ubuntu *** 作系统并且和windows组成双系统。由于Win 7已经无法支持x299主板芯片，表现为键鼠等无法识别，所以windows系统选择win10；ubuntu版本目前最新为ubuntu1804，可以安装，但是不建议安装最新版本，因为1804版本里安装并行环境以及QE编译等会遇到很多问题，需要额外做些多余的工作，问题很多，如果为了稳妥，建议直接安装ubuntu1604LTS版本。后者由于linux内核版本较低，可能安装后无法识别Geforce显卡以及无线网卡，而ubuntu1804则无此问题。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zz/13434776.html

推荐一款适合深度学习AI场景应用性能较好的服务器

发表评论

评论列表（0条）