Linux中如何管理Nvidia GPU卡

Linux中如何管理Nvidia GPU卡,第1张

1查看显卡信息

由于测试环境使用的是NVIDIA的显卡,这里直接通过lspci命令即可查询具体显卡信息

“00:060”,这一个参数是总线编号,第二个是插槽编号,第三个是功能编号,它们都是十六进制的数字。

2查看显存以及GPU的使用情况

Nvidia自带一个命令行工具可以查看显存的使用情况: nvidia-smi

参数解释:

Fan: 显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A;

Temp: 显卡内部的温度,单位是摄氏度;

Perf: 表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;

Pwr: 能耗表示;

Bus-Id: 涉及GPU总线的相关信息;

DispA: 是Display Active的意思,表示GPU的显示是否初始化;

Memory Usage: 显存的使用率;

Volatile GPU-Util: 浮动的GPU利用率;

Compute M: 计算模式;

下边的Processes显示每块GPU上每个进程所使用的显存情况,上述测试环境没有,可参考它图如下:

3周期性的输出显卡的使用情况

可以参考如下命令:

命令行参数-n后边跟的是执行命令的周期,以s为单位。

1列出所有可用的Nvidia设备

2列出每个GPU卡的详细信息

3查询某个GPU卡的详细信息 (指定GPU卡的id,只截图一部分)

4要以1秒的更新间隔监控GPU的总体使用情况

5要以1秒的更新间隔监视每个进程的GPU使用情况

6加上-pm参数可设置持久模式:0/禁用,1/启用

7加上-e参数可以切换ECC支持:0/禁用,1/启用

8 加上-r参数可以重启某个GPU卡(0是GPU卡的序号)

lm是lm_sensors软件。

是一款基于linux系统的硬件监控的软件。可以监控主板,CPU的工作电压,温度等数据。

lm_sensors简介:

lm_sensors是一款linux的硬件监控的软件,可以帮助我们来监控主板,CPU的工作电压,风扇转速、温度等数据。这些数据我们通常在主板的 BIOS也可以看到。当我们可以在机器运行的时候通过lm_sensors随时来监测着CPU的温度变化,可以预防和保护因为CPU过热而会烧掉。

群晖cpu风扇转速1000转。解决这个风扇噪音的方法,或许可以通过更换风扇,或安装降速线解决,但是我觉得可以尝试用软件上的方法解决。相对对WINDOWs系统,有非常多的风扇转速控制软件,群晖使用的是Linux系统,也许也是可以做到的。风扇以较低的速度运转,发出的噪音较少,但SynologyNAS的温度可能会升高。

群晖的特点

群晖DS220加是一款2盘位的爆款NAS,相信已经有很多人已经入手了这个入门款机器。它采用了英特尔J4025处理器,配置2GBDDR4内存,可以升级至6GB,提供2个USB3点0接口以及2个RJ45接口,小机身设计深得大众喜爱。

本次笔者使用的硬盘是希捷酷狼4TBNAS硬盘。希捷酷狼系列与酷狼Pro系列全系都是CMR传统磁记录技术,相比于SMR,它更适合作为NAS硬盘使用。

以上就是关于Linux中如何管理Nvidia GPU卡全部的内容,包括:Linux中如何管理Nvidia GPU卡、lm是什么软件、群晖cpu风扇转速等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/10147692.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-05
下一篇 2023-05-05

发表评论

登录后才能评论

评论列表(0条)

保存