深度学习系统是用桌面版还是服务器版_服务器

您可以咨询联众集群（LINKZOL®）
如果以稳定性来说Server版的UBUNTU系统是要稳定一些的，两者无所谓，看你是否需要使用桌面图形，如果是在字符界面下 *** 作那么server版本的更合适些，因为UBUNTU系统本来应用于深度学习环境就有很多兼容性问题，所以建议用server版本的。
你可以咨询下他们，他们主要做深度学习方向的GPU服务器和GPU工作站。

深度学习服务器/工作站，不能单独考虑硬件配置高低，以及预算多少，要根据使用者的类型，配置合理的硬件，硬件配置至少分为两个类型：

一、深度学习开发工作站/服务器

基本要求：

1）处理器:8核或以上

2）内存：64G内存或以上

3）GPU：1-4块GTX1080Ti,GTX Titan XP/V,Quadro GP100

4）系统硬盘：选用高速的SSD固态硬盘

二、深度学习训练工作站/服务器

基本要求：

1）处理器:8核或以上

2）内存：128G内存以上

3）GPU：4-10块Tesla系列GPU（K40,K80,P100,V100）

4）系统硬盘：选用高速的SSD固态硬盘组阵列（工作站：要求噪音小，适合办公室使用，服务器：要求密度高，噪音大，一般适用于机房）

蓝海大脑作为深度学习、高性能计算、生命科学、医药研发、遥感测绘领域的资深专家认为：这里驱动能力是指，在小于等于最大输入电流的情况下，I/O引脚可以正常的输出逻辑0。道理同上，流过N-MOS电流越大，N-MOS产生压降越大，I/O口电压越大。当电压达到逻辑0的最高电压Vol时，这时的电流就表示驱动能力。
1）I/O驱动能力是指在同时满足Voh(输出引脚为逻辑1时的最小电压值) 和 Vol(输出引脚为逻辑0时的最大电压值）前提下，最大可以输出和吸收的电流大小。Voh和Vol的值在芯片数据手册中可以查到。
2）如果某I/O的驱动能力是5mA，并不是表示它输出不了超过5mA的电流，只是当输出电流超过5mA之后，它的输出电压会下降，电压会小于Voh。
3）I/O驱动能力的差异来源于MOS管自身的特性，要想过电流能力大，MOS管体积就要大，芯片所需的面积就会更大，成本自然也会更高。所以通常MCU只是一部分I/O具有高驱动能力，并不是每一个I/O都做成了高驱动能力。

深度学习是机器学习的分支，是一种以人工神经网络为架构，对数据进行表征学习的算法。深度学习在搜索技术，数据挖掘，机器学习，机器翻译，自然语言处理等多个领域都取得了卓越的成果，可见其重要性

熟悉深度学习的人都知道，深度学习是需要训练的，所谓的训练就是在成千上万个变量中寻找最佳值的计算。这需要通过不断的尝试识别，而最终获得的数值并非是人工确定的数字，而是一种常态的公式。通过这种像素级的学习，不断总结规律，计算机就可以实现像人一样思考。因而，更擅长并行计算和高带宽的GPU，则成了大家关注的重点。

很多人认为深度学习GPU服务器配置跟普通服务器有些不一样，就像很多人认为做设计的机器一定很贵一样。其实只要显卡或者CPU满足深度学习的应用程序就可以进行深度学习。由于现在CPU的核心数量和架构相对于深度学习来说效率会比GPU低很多，所以大部分深度学习的服务器都是通过高端显卡来运算的。

这里谈谈关于深度学习GPU服务器如何选择，深度学习服务器的一些选购原则和建议：

1、电源：品质有保障，功率要足够，有30~40%冗余

稳定、稳定、还是稳定。一个好的电源能够保证主机再长时间运行不宕机和重启。可以想象一下，计算过程中突然重启，那么又要重来，除了降低效率，还影响心情。有些电源低负载使用的时候可能不出问题，一旦高负载运行的时候就容易出问题。选择电源的时候一定要选择功率有冗余品质过硬，不要功率刚刚好超出一点。

2、显卡：目前主流RTX3090,最新RTX4090也将上市

显卡在深度学习中起到很重要的作用，也是预算的一大头。预算有限，可以选择RTX3080 /RTX3090/RTX4090(上月刚发布，本月12日上市)。预算充足，可以选择专业深度学习卡Titan RTX/Tesla V100 /A6000/A100/H100（处于断供中）等等。

3、CPU：两家独大，在这要讲的是PC级和服务器级别处理器的定位

Intel的处理器至强Xeon、酷睿Core、赛扬Celeron、奔腾Pentium和凌动Atom5个系列，而至强是用于服务器端，目前市场上最常见的是酷睿。当下是第三代Xeon Scalable系列处理器，分为Platinum白金、Gold金牌、 Silver 银牌。

AMD处理器分为锐龙Ryzen、锐龙Ryzen Pro、锐龙线程撕裂者Ryzen Threadripper、霄龙EPYC，其中霄龙是服务器端的CPU，最常见的是锐龙。当下是第三代 EPYC（霄龙）处理器，AMD 第三代 EPYC 7003 系列最高 64核。

选择单路还是双路也是看软件，纯粹的使用GPU运算，其实CPU没有多大负载。考虑到更多的用途，当然CPU不能太差。主流的高性能多核多线程CPU即可。

4、内存：单根16G/32G/64G 可选，服务器级别内存有ECC功能，PC级内存没有，非常重要

内存32G起步，内存都是可以扩展的，所以够用就好，不够以后可以再加，买多了是浪费。

5、硬盘：固态硬盘和机械硬盘，通常系统盘追求速度用固态硬盘，数据盘强调存储量用机械盘

固态选择大品牌企业级，Nvme或者SATA协议区别不大，杂牌固态就不要考虑了，用着用着突然掉盘就不好了。

6、机箱平台：服务器级别建议选择超微主板平台，稳定性、可靠性是第一要求

预留足够的空间方便升级，比如现在使用单显卡，未来可能要加显卡等等；结构要合理，合理的空间更利于空气流动。最好是加几个散热效果好的机箱风扇辅助散热。温度也是导致不稳定的一个因素。

7、软硬件支持/解决方案：要有

应用方向：深度学习、量化计算、分子动力学、生物信息学、雷达信号处理、地震数据处理、光学自适应、转码解码、医学成像、图像处理、密码破解、数值分析、计算流体力学、计算机辅助设计等多个科研领域。

软件： Caffe, TensorFlow, Abinit, Amber, Gromacs, Lammps, NAMD, VMD, Materials Studio, Wien2K, Gaussian, Vasp, CFX, OpenFOAM, Abaqus, Ansys, LS-DYNA, Maple, Matlab, Blast, FFTW, Nastran等软件的安装、调试、优化、培训、维护等技术支持和服务。

————————————————

原文链接：>

在深度学习场景中，GPU服务器是必不可少的一部分，也是可以提高计算速度和精度的关键，以下是几种适合深度学习场景的GPU服务器：
1 NVIDIA Tesla V100 服务器：具备高性能计算能力和内存容量，适用于深度学习、大规模数据分析和AI训练等场景。
2 AMD Radeon Instinct MI60 Server：可用于机器学习、高性能计算和图形渲染等领域，具备高速内存、流式计算和稳定性等特点。
3 Intel Movidius Neural Compute Stick：便携式的神经计算设备，可以利用USB接口与其他设备连接，适用于嵌入式设备上的深度学习场景。
以上服务器都具有针对深度学习的高速计算能力、可靠性和易用性，对于需要进行大规模数据训练、模型评估和推理等任务的用户群体非常适用。

搞AI，谁又能没有“GPU之惑”？下面列出了一些适合进行深度学习模型训练的GPU，并将它们进行了横向比较，一起来看看吧！

CPU与GPU对比

CPU是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强，计算能力则位于其次。而GPU相当于一个接受CPU调度的“拥有大量计算能力”的员工。

下图是处理器内部结构图：

DRAM即动态随机存取存储器，是常见的系统内存。

Cache存储器：电脑中作为高速缓冲存储器，是位于CPU和主存储器DRAM之间，规模较小，但速度很高的存储器。

算术逻辑单元ALU是能实现多组算术运算和逻辑运算的组合逻辑电路。

当需要对大数据bigdata做同样的事情时，GPU更合适，当需要对同一数据做很多事情时，CPU正好合适。

GPU能做什么？关于图形方面的以及大型矩阵运算，如机器学习算法等方面，GPU就能大显身手。

简而言之，CPU擅长统领全局等复杂 *** 作，GPU擅长对大数据进行简单重复 *** 作。CPU是从事复杂脑力劳动的教授，而GPU是进行大量并行计算的体力劳动者。

深度学习是模拟人脑神经系统而建立的数学网络模型，这个模型的最大特点是，需要大数据来训练。因此，对电脑处理器的要求，就是需要大量的并行的重复计算，GPU正好有这个专长，时势造英雄，因此，GPU就出山担当重任了。

太长不看版
截至2020年2月，以下GPU可以训练所有当今语言和图像模型：

RTX 8000：48GB VRAM，约5500美元RTX 6000：24GB VRAM，约4000美元Titan RTX：24GB VRAM，约2500美元
以下GPU可以训练大多数（但不是全部）模型：RTX 2080 Ti：11GB VRAM，约1150美元GTX 1080 Ti：11GB VRAM，返厂翻新机约800美元RTX 2080：8GB VRAM，约720美元RTX 2070：8GB VRAM，约500美元
以下GPU不适合用于训练现在模型：RTX 2060：6GB VRAM，约359美元。
在这个GPU上进行训练需要相对较小的batch size，模型的分布近似会受到影响，从而模型精度可能会较低。
GPU购买建议
RTX 2060（6 GB）：你想在业余时间探索深度学习。RTX 2070或2080（8 GB）：你在认真研究深度学习，但GPU预算只有600-800美元。8 GB的VRAM适用于大多数模型。RTX 2080 Ti（11 GB）：你在认真研究深度学习并且您的GPU预算约为1,200美元。RTX 2080 Ti比RTX 2080快大约40％。Titan RTX和Quadro RTX 6000（24 GB）：你正在广泛使用现代模型，但却没有足够买下RTX 8000的预算。Quadro RTX 8000（48 GB）：你要么是想投资未来，要么是在研究2020年最新最酷炫的模型。NV TESLA V100 （32GB）：如果你需要在NVIDIA数据中心使用CUDA，那么TESLA就是必选品了。图像模型
内存不足之前的最大批处理大小：表示GPU没有足够的内存来运行模型。
性能（以每秒处理的图像为单位）：表示GPU没有足够的内存来运行模型。
语言模型
内存不足之前的最大批处理大小：表示GPU没有足够的内存来运行模型。
性能： GPU没有足够的内存来运行模型。
使用Quadro RTX 8000结果进行标准化后的表现
图像模型
语言模型

结论
语言模型比图像模型受益于更大的GPU内存。注意右图的曲线比左图更陡。这表明语言模型受内存大小限制更大，而图像模型受计算力限制更大。具有较大VRAM的GPU具有更好的性能，因为使用较大的批处理大小有助于使CUDA内核饱和。具有更高VRAM的GPU可按比例实现更大的批处理大小。只懂小学数学的人都知道这很合理：拥有24 GB VRAM的GPU可以比具有8 GB VRAM的GPU容纳3倍大的批次。比起其他模型来说，长序列语言模型不成比例地占用大量的内存，因为注意力（attention）是序列长度的二次项。
附注：测试模型
图像模型：
语言模型：

云轩Cloudhin专注Deep learning和高性能计算服务器定制，针对主要深度学习框架（如TensorFlow、Caffe 2、Theano或Torch）进行了优化和设置，在桌面上即可提供强大的深度学习功能。

珍岛GPU云服务器。
珍岛GPU云服务器适用于深度学习，针对AI，数据分析在各种规模上实现出色的加速，应对极其严峻的计算挑战，同时珍岛云提供多种GPU实例规格。

需要安装。
1。安装系统。1。安装ubuntu。具体安装省略，记录一个小bug，可能在给有独立显卡的台式机安装ubuntu双系统时遇到：在安装时，使用U盘启动这步，直接选择tryubuntu或installubuntu都会出现黑屏的问题。解决方法：将光标移动到installubuntu一项上，按e键，会进入一个可编辑的界面，将quietsplash修改为nouveau。modeset=0nomodeset，然后按ctrl+x进入安装。之后在ubuntu安装nvidia驱动后，就正常了。如果没有安装驱动，每次进入前，都要用同样的方法将上面的quietsplash修改。2。配置nvidia显卡。具体分为两步：安装nvidia驱动，如果是图形界面的话，在Software&Updates中的AdditionalDrivers中选择合适的驱动安装即可。在官网下载cudnn并安装。2。创建和登录用户。在linux上创建自己的用户，方便管理代码和安装应用。比如我们想要创建一个用户名是haha，密码是123456的用户，命令如下：添加用户：useradd-d/home/haha-mhaha。设置密码(只有设置密码之后，才能登录用户)：passwdhaha，然后输入密码。然后就可以通过sshhaha@your_ip的方式登录服务器了。登录后也可以设置bash：chsh-s/bin/bash或修改为zsh。加入root权限：使用apt下载时，如果出现不在sudoers文件中的报错，则需要将用户加入sudoers，执行sudovim/etc/sudoers命令，rootALL=(ALL)ALL的下一行加入hahaALL=(ALL)ALL，然后保存。删除用户：userdel-rhaha。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/10406145.html

深度学习系统是用桌面版还是服务器版

发表评论

评论列表（0条）