深度学习是需要配置专门的GPU服务器的:
深度学习的电脑配置要求:
1、数据存储要求
在一些深度学习案例中,数据存储会成为明显的瓶颈。做深度学习首先需要一个好的存储系统,将历史资料保存起来。
主要任务:历史数据存储,如:文字、图像、声音、视频、数据库等。
数据容量:提供足够高的存储能力。
读写带宽:多硬盘并行读写架构提高数据读写带宽。
接口:高带宽,同时延迟低。
传统解决方式:专门的存储服务器,借助万兆端口访问。
缺点:带宽不高,对深度学习的数据读取过程时间长(延迟大,两台机器之间数据交换),成本还巨高。
2、CPU要求
当你在GPU上跑深度网络时,CPU进行的计算很少,但是CPU仍然需要处理以下事情:
(1)数据从存储系统调入到内存的解压计算。
(2)GPU计算前的数据预处理。
(3)在代码中写入并读取变量,执行指令如函数调用,创建小批量数据,启动到GPU的数据传输。
(4)GPU多卡并行计算前,每个核负责一块卡的所需要的数据并行切分处理和控制。
(5)增值几个变量、评估几个布尔表达式、在GPU或在编程里面调用几个函数——所有这些会取决于CPU核的频率,此时唯有提升CPU频率。
传统解决方式:CPU规格很随意,核数和频率没有任何要求。
3、GPU要求
如果你正在构建或升级你的深度学习系统,你最关心的应该也是GPU。GPU正是深度学习应用的核心要素——计算性能提升上,收获巨大。
主要任务:承担深度学习的数据建模计算、运行复杂算法。
传统架构:提供1~8块GPU。
4、内存要求
至少要和你的GPU显存存大小相同的内存。当然你也能用更小的内存工作,但是,你或许需要一步步转移数据。总而言之,如果钱够而且需要做很多预处理,就不必在内存瓶颈上兜转,浪费时间。
主要任务:存放预处理的数据,待GPU读取处理,中间结果存放。
深度学习需要强大的电脑算力,因此对电脑的硬件配置自然是超高的,那么现在普通的高算力电脑需要高配置硬件。
之前我司在做冷冻电镜项目时,有了解过蓝海大脑的深度学习液冷服务器,总结下来具备低成本、高效率的竞争优势。其中,液冷高密度服务器在2U空间支持4个双路节点,能够长期稳定工作于高性能模式,对机房适应性提升⌄可适应客户机房较高温度和高海拔环境,解决高功率CPU散热问题;采用温水冷却方式和CPU+VR+DIMM液冷板,PUE可达到12以下,显著降低制冷成本,并支持可移动的风液交换式CDU方案部署便捷。被广泛用在企业数据中心、云计算、人工智能、边缘计算、生命科学、遥感测绘、冷冻电镜等领域。深度学习是机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理等多个领域都取得了卓越的成果,可见其重要性
熟悉深度学习的人都知道,深度学习是需要训练的,所谓的训练就是在成千上万个变量中寻找最佳值的计算。这需要通过不断的尝试识别,而最终获得的数值并非是人工确定的数字,而是一种常态的公式。通过这种像素级的学习,不断总结规律,计算机就可以实现像人一样思考。因而,更擅长并行计算和高带宽的GPU,则成了大家关注的重点。
很多人认为深度学习GPU服务器配置跟普通服务器有些不一样,就像很多人认为做设计的机器一定很贵一样。其实只要显卡或者CPU满足深度学习的应用程序就可以进行深度学习。由于现在CPU的核心数量和架构相对于深度学习来说效率会比GPU低很多,所以大部分深度学习的服务器都是通过高端显卡来运算的。
这里谈谈关于深度学习GPU服务器如何选择,深度学习服务器的一些选购原则和建议:
1、电源:品质有保障,功率要足够,有30~40%冗余
稳定、稳定、还是稳定。一个好的电源能够保证主机再长时间运行不宕机和重启。可以想象一下,计算过程中突然重启,那么又要重来,除了降低效率,还影响心情。有些电源低负载使用的时候可能不出问题,一旦高负载运行的时候就容易出问题。选择电源的时候一定要选择功率有冗余品质过硬,不要功率刚刚好超出一点。
2、显卡:目前主流RTX3090,最新RTX4090也将上市
显卡在深度学习中起到很重要的作用,也是预算的一大头。预算有限,可以选择RTX3080 /RTX3090/RTX4090(上月刚发布,本月12日上市)。预算充足,可以选择专业深度学习卡Titan RTX/Tesla V100 /A6000/A100/H100(处于断供中)等等。
3、CPU:两家独大,在这要讲的是PC级和服务器级别处理器的定位
Intel的处理器至强Xeon、酷睿Core、赛扬Celeron、奔腾Pentium和凌动Atom5个系列,而至强是用于服务器端,目前市场上最常见的是酷睿。当下是第三代Xeon Scalable系列处理器,分为Platinum白金、Gold金牌、 Silver 银牌。
AMD处理器分为锐龙Ryzen、锐龙Ryzen Pro、锐龙线程撕裂者Ryzen Threadripper、霄龙EPYC,其中霄龙是服务器端的CPU,最常见的是锐龙。当下是第三代 EPYC(霄龙)处理器 ,AMD 第三代 EPYC 7003 系列最高 64核。
选择单路还是双路也是看软件,纯粹的使用GPU运算,其实CPU没有多大负载。考虑到更多的用途,当然CPU不能太差。主流的高性能多核多线程CPU即可。
4、内存:单根16G/32G/64G 可选,服务器级别内存有ECC功能,PC级内存没有,非常重要
内存32G起步,内存都是可以扩展的,所以够用就好,不够以后可以再加,买多了是浪费。
5、硬盘:固态硬盘和机械硬盘,通常系统盘追求速度用固态硬盘,数据盘强调存储量用机械盘
固态选择大品牌企业级,Nvme或者SATA协议区别不大,杂牌固态就不要考虑了,用着用着突然掉盘就不好了。
6、机箱平台:服务器级别建议选择超微主板平台,稳定性、可靠性是第一要求
预留足够的空间方便升级,比如现在使用单显卡,未来可能要加显卡等等;结构要合理,合理的空间更利于空气流动。最好是加几个散热效果好的机箱风扇辅助散热。温度也是导致不稳定的一个因素。
7、软硬件支持/解决方案:要有
应用方向:深度学习、量化计算、分子动力学、生物信息学、雷达信号处理、地震数据处理、光学自适应、转码解码、医学成像、图像处理、密码破解、数值分析、计算流体力学、计算机辅助设计等多个科研领域。
软件: Caffe, TensorFlow, Abinit, Amber, Gromacs, Lammps, NAMD, VMD, Materials Studio, Wien2K, Gaussian, Vasp, CFX, OpenFOAM, Abaqus, Ansys, LS-DYNA, Maple, Matlab, Blast, FFTW, Nastran等软件的安装、调试、优化、培训、维护等技术支持和服务。
————————————————
版权声明:本文为CSDN博主「Ai17316391579」的原创文章,遵循CC 40 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:>
1U即4445mm=4445cmU,即机架尺寸,是美国电子工业联盟(EIA)用来标定服务器、网络交换机等机房设备的单位。
没有什么所谓的短1U,标准机架尺寸都是按U来计算的,如果非标准机架,尺寸就不定了,要看生产厂家提供的资料才知道具体尺寸。
一、什么是超融合?有什么优势?
说到这个就不得不先提及超融合替代的产品:传统IT架构。
通过国外的Nutanix、VMware(vSAN),中国的SmartX等超融合厂商的案例描述中看到,他们所替代的产品大量的是老牌存储厂商EMC、HDS等公司的存储产品。所以,用户采购超融合并不必须替换原有的服务器品牌(比如Dell)或者虚拟化品牌(比如VMware),只有存储(比如EMC)是一定需要替换的。所以最重大的区别是存储架构不同,超融合使用的是分布式存储,它可以很好地基于X86服务器构建一个易扩展、高可靠的存储资源池,这是超融合的基础,也是核心技术点。
传统IT架构与超融合架构的区别与对比
具体而言有以下几方面的区别:
物理融合及管理融合:超融合架构把服务器、网络及存储进行了融合,并且搭载在统一管理平台上进行维护;而传统架构则是全部分离的。
存储架构:超融合采用分布式存储,传统架构使用集中式存储。
网络:超融合使用万兆以太网,而传统架构多使用光纤交换机。
可靠性方面:可以看出可靠性方面,超融合架构的优势非常大,但其实这里的优势都是分布式存储本身应该具备的。
性能方面:超融合在性能方面的架构优势非常明显,当然代价就是消耗计算资源,所以计算资源的消耗是检验超融合专业性的一个重要因素。
扩展性方面:超融合的架构是扩展能力强,扩容简单快速,系统复杂度不会随扩容增加而增加。
部署运维方面:相对传统架构,超融合布局,维护简单,能够在一定程度上智能运维。
二、超融合一体机有什么好处?
超融合一体机是指厂商根据客户的需求,和自身的产品策略,为用户提供的开箱即用,一体机化的交付方式,一体机包含了软件和 厂商选定并适配的 x86 服务器。可见开箱即用,一体化交付是其最大优势。在简化部署、维护,以及可用性,可靠性等方面优势更明显。具体如下:
1) 简化了部署,加快了业务上线时间
以前企业在部署自己的IT系统时,往往需要采购不同的设备,安装调试过程比较长,甚至会影响业务的上线时间。有了超融合一体机,企业只需要购买一台这样的产品即可,安装和调试过程非常方便,大大简化了部署难度,加快了业务的上线时间。
2) 降低了运维难度和成本
以前公司有多少种不同的硬件设备,就需要多少个不同专业的技术人员,采用超融合一体机后,系统管理难度降低,一个技术人员就可以轻松搞定,降低了运维的难度和成本。
3) 提高了设备的可靠性和可用性
超融合一体机在设备故障方面要低很多,即使出现问题,解决起来也相对比较简单和快速,这就很好的提高了它的可靠性和可用性。
4) 节省了开支
相对于多台设备组成的IT系统的采购价格而言,超融合一体机的售价会低很多。
三、联想超融合一体机怎么样?
2019 Gartner 中国超融合厂商竞争格局报告,列举了包括SMARTX在内的近十家国内超融合厂商,算是一个比较不错的参考。
1按应用层次划分为入门级服务器、工作组级服务器、部门级服务器和企业级服务器四类。
入门级服务器
入门级服务器通常只使用一块CPU,并根据需要配置相应的内存(如256MB)和大容量IDE硬盘,必要时也会采用IDE RAID(一种磁盘阵列技术,主要目的是保证数据的可靠性和可恢复性)进行数据保护。入门级服务器主要是针对基于Windows NT,NetWare等网络 *** 作系统的用户,可以满足办公室型的中小型网络用户的文件共享、打印服务、数据处理、Internet接入及简单数据库应用的需求,也可以在小范围内完成诸如E-mail、 Proxy 、DNS等服务。
对于一个小部门的办公需要而言,服务器的主要作用是完成文件和打印服务,文件和打印服务是服务器的最基本应用之一,对硬件的要求较低,一般采用单颗或双颗CPU的入门级服务器即可。为了给打印机提供足够的打印缓冲区需要较大的内存,为了应付频繁和大量的文件存取要求有快速的硬盘子系统,而好的管理性能则可以提高服务器的使用效率。
工作组级服务器
工作组级服务器一般支持1至2个PⅢ处理器或单颗P4(奔腾4)处理器,可支持大容量的ECC(一种内存技术,多用于服务器内存)内存,功能全面。可管理性强、且易于维护,具备了小型服务器所必备的各种特性,如采用SCSI(一种总线接口技术)总线的I/O(输入/输出)系统,SMP对称多处理器结构、可选装RAID、热插拔硬盘、热插拔电源等,具有高可用性特性。适用于为中小企业提供Web、Mail等服务,也能够用于学校等教育部门的数字校园网、多媒体教室的建设等。
通常情况下,如果应用不复杂,例如没有大型的数据库需要管理,那么采用工作组级服务器就可以满足要求。目前,国产服务器的质量已与国外著名品牌相差无几,特别是在中低端产品上,国产品牌的性价比具有更大的优势,中小企业可以考虑选择一些国内品牌的产品。此外,HP等大厂商甚至推出了专门为中小企业定制的服务器。但个别企业如果业务比较复杂,数据流量比较多,而且资金允许的情况下,也可以考虑选择部门级和企业级的服务器来作为其关键任务服务器。目前HP、DELL、IBM、浪潮都是较不错的品牌。
部门级服务器
部门级服务器通常可以支持2至4个PⅢ Xeon(至强)处理器,具有较高的可靠性、可用性、可扩展性和可管理性。首先,集成了大量的监测及管理电路,具有全面的服务器管理能力,可监测如温度、电压、风扇、机箱等状态参数。此外,结合服务器管理软件,可以使管理人员及时了解服务器的工作状况。同时,大多数部门级服务器具有优良的系统扩展性,当用户在业务量迅速增大时能够及时在线升级系统,可保护用户的投资。目前,部门级服务器是企业网络中分散的各基层数据采集单位与最高层数据中心保持顺利连通的必要环节。适合中型企业(如金融、邮电等行业)作为数据中心、Web站点等应用。
企业级服务器
企业级服务器属于高档服务器,普遍可支持4至8个PIII Xeon(至强)或P4 Xeon(至强)处理器,拥有独立的双PCI通道和内存扩展板设计,具有高内存带宽,大容量热插拔硬盘和热插拔电源,具有超强的数据处理能力。这类产品具有高度的容错能力、优异的扩展性能和系统性能、极长的系统连续运行时间,能在很大程度上保护用户的投资。可作为大型企业级网络的数据库服务器。
目前,企业级服务器主要适用于需要处理大量数据、高处理速度和对可靠性要求极高的大型企业和重要行业(如金融、证券、交通、邮电、通信等行业),可用于提供ERP(企业资源配置)、电子商务、OA(办公自动化)等服务。如Dell的PowerEdge 4600服务器,标准配置为24GHz Intel Xeon处理器,最大支持12GB的内存。此外,采用了Server Works GC-HE芯片组,支持2至4路Xeon处理器。集成了RAID控制器并配备了128MB缓存,可以为用户提供0、1、5、10四个级别的RAID,最大可以支持10个热插拔硬盘并提供730GB的磁盘存储空间。
由于是面向企业级应用,所在在可维护性以及冗余性能上有其独到的地方,例如配备了7个PCI-X插槽(其中6个支持热插拔),而且不需任何工具即可对冗余风扇、电源以及PCI-X进行安装和更换。
2按服务器的处理器架构(也就是服务器CPU所采用的指令系统)划分把服务器分为CISC架构服务器、RISC架构服务器和VLIW架构服务器三种。
CISC架构服务器
CISC的英文全称为“Complex Instruction Set Computer”,即“复杂指令系统计算机”,从计算机诞生以来,人们一直沿用CISC指令集方式。早期的桌面软件是按CISC设计的,并一直沿续到现在,所以,微处理器(CPU)厂商一直在走CISC的发展道路,包括Intel、AMD,还有其他一些现在已经更名的厂商,如TI(德州仪器)、Cyrix以及VIA(威盛)等。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个 *** 作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。CISC架构的服务器主要以IA-32架构(Intel Architecture,英特尔架构)为主,而且多数为中低档服务器所采用。
如果企业的应用都是基于NT平台的应用,那么服务器的选择基本上就定位于IA架构(CISC架构)的服务器。如果企业的应用主要是基于Linux *** 作系统,那么服务器的选择也是基于IA结构的服务器。如果应用必须是基于Solaris的,那么服务器只能选择SUN服务器。如果应用基于AIX(IBM的Unix *** 作系统)的,那么只能选择IBM Unix服务器(RISC架构服务器)。
RISC架构服务器
RISC的英文全称为“Reduced Instruction Set Computing”,中文即“精简指令集”,它的指令系统相对简单,它只要求硬件执行很有限且最常用的那部分执令,大部分复杂的 *** 作则使用成熟的编译技术,由简单指令合成。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。在中高档服务器中采用RISC指令的CPU主要有Compaq(康柏,即新惠普)公司的Alpha、HP公司的PA-RISC、IBM公司的Power PC、MIPS公司的MIPS和SUN公司的Spare。
VLIW架构服务器
VLIW是英文“Very Long Instruction Word”的缩写,中文意思是“超长指令集架构”,VLIW架构采用了先进的EPIC(清晰并行指令)设计,我们也把这种构架叫做“IA-64架构”。每时钟周期例如IA-64可运行20条指令,而CISC通常只能运行1-3条指令,RISC能运行4条指令,可见VLIW要比CISC和RISC强大的多。VLIW的最大优点是简化了处理器的结构,删除了处理器内部许多复杂的控制电路,这些电路通常是超标量芯片(CISC和RISC)协调并行工作时必须使用的,VLIW的结构简单,也能够使其芯片制造成本降低,价格低廉,能耗少,而且性能也要比超标量芯片高得多。目前基于这种指令架构的微处理器主要有Intel的IA-64和AMD的x86-64两种。
3按服务器按用途划分为通用型服务器和专用型服务器两类。
通用型服务器
通用型服务器是没有为某种特殊服务专门设计的、可以提供各种服务功能的服务器,当前大多数服务器是通用型服务器。这类服务器因为不是专为某一功能而设计,所以在设计时就要兼顾多方面的应用需要,服务器的结构就相对较为复杂,而且要求性能较高,当然在价格上也就更贵些。
专用型服务器
专用型(或称“功能型”)服务器是专门为某一种或某几种功能专门设计的服务器。在某些方面与通用型服务器不同。如光盘镜像服务器主要是用来存放光盘镜像文件的,在服务器性能上也就需要具有相应的功能与之相适应。光盘镜像服务器需要配备大容量、高速的硬盘以及光盘镜像软件。FTP服务器主要用于在网上(包括Intranet和Internet)进行文件传输,这就要求服务器在硬盘稳定性、存取速度、I/O(输入/输出)带宽方面具有明显优势。而E-mail服务器则主要是要求服务器配置高速宽带上网工具,硬盘容量要大等。这些功能型的服务器的性能要求比较低,因为它只需要满足某些需要的功能应用即可,所以结构比较简单,采用单CPU结构即可;在稳定性、扩展性等方面要求不高,价格也便宜许多,相当于2台左右的高性能计算机价格。HP的一款Web服务器HP access server,它采用的是PIII113Gbit/s左右的CPU,内存标准配置也只有128MB/256MB,与一台性能较好的普通计算机差不多,但在某些方它还是具有PC机无可替代的优势。
4按服务器的机箱结构来划分,可以把服务器划分为“台式服务器”、“机架式服务器”,“机柜式服务器”和“刀片式服务器”四类。
台式服务器
台式服务器也称为“塔式服务器”。有的台式服务器采用大小与普通立式计算机大致相当的机箱,有的采用大容量的机箱,像个硕大的柜子。低档服务器由于功能较弱,整个服务器的内部结构比较简单,所以机箱不大,都采用台式机箱结构。这里所介绍的台式不是平时普通计算机中的台式,立式机箱也属于台式机范围,目前这类服务器在整个服务器市场中占有相当大的份额。
机架式服务器
机架式服务器的外形看来不像计算机,而像交换机,有1U(1U=175英寸)、2U、4U等规格。机架式服务器安装在标准的19英寸机柜里面。这种结构的多为功能型服务器。
对于信息服务企业(如ISP/ICP/ISV/IDC)而言,选择服务器时首先要考虑服务器的体积、功耗、发热量等物理参数,因为信息服务企业通常使用大型专用机房统一部署和管理大量的服务器资源,机房通常设有严密的保安措施、良好的冷却系统、多重备份的供电系统,其机房的造价相当昂贵。如何在有限的空间内部署更多的服务器直接关系到企业的服务成本,通常选用机械尺寸符合19英寸工业标准的机架式服务器。机架式服务器也有多种规格,例如1U(445cm高)、2U、4U、6U、8U等。通常1U的机架式服务器最节省空间,但性能和可扩展性较差,适合一些业务相对固定的使用领域。4U以上的产品性能较高,可扩展性好,一般支持4个以上的高性能处理器和大量的标准热插拔部件。管理也十分方便,厂商通常提供人相应的管理和监控工具,适合大访问量的关键应用,但体积较大,空间利用率不高。
机柜式服务器
在一些高档企业服务器中由于内部结构复杂,内部设备较多,有的还具有许多不同的设备单元或几个服务器都放在一个机柜中,这种服务器就是机柜式服务器。
对于证券、银行、邮电等重要企业,则应采用具有完备的故障自修复能力的系统,关键部件应采用冗余措施,对于关键业务使用的服务器也可以采用双机热备份高可用系统或者是高性能计算机,这样的系统可用性就可以得到很好的保证。
刀片式服务器
刀片服务器是一种高可用高密度的低成本服务器平台,是专门为特殊应用行业和高密度计算机环境设计的,目前最适合群集计算和IxP提供互联网服务。其中每一块“刀片”实际上就是一块系统主板。它们可以通过本地硬盘启动自己的 *** 作系统,如Windows NT/2000、Linux、Solaris等等,类似于一个个独立的服务器。在这种模式下,每一个主板运行自己的系统,服务于指定的不同用户群,相互之间没有关联。不过可以用系统软件将这些主板集合成一个服务器集群。
刀片服务器近几年才刚刚兴起,我国的用户数量还不是很多,以数据中心和科研机构为多。但是由于符合未来计算模式的发展方向,国内外重要的服务器厂商Dell、HP、IBM、浪潮、联想、曙光等在国内都已纷纷推出了刀片式服务器产品。
当前市场上的刀片式服务器有两大类:一类主要为电信行业设计,接口标准和尺寸规格符合PICMG 1x或2x,未来还将推出符合PICMG 3x的产品,采用相同标准的不同厂商的刀片和机柜在理论上可以互相兼容;另一类为通用计算设计,接口上可能采用了上述标准或厂商标准,但尺寸规格是厂商自定,注重性能价格比,目前属于这一类的产品居多。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)