ibm服务器不开机闪绿灯

ibm服务器不开机闪绿灯,第1张

overspec指示灯当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。
log指示灯:当此指示灯发亮时,表明事件日志有报错,应该查看事件日志。
link指示灯:当此指示灯发亮时,网卡出现故障。
ps指示灯:当此指示灯发亮时,表明电源出现故障。
pci指示灯:当此指示灯发亮时,表明某个pci总线发生错误。
sp指示灯:当此指示灯发亮时,表明流处理器遇到错误(sp的作用就是处理由CPU传输过来的数据,处理后转化为显示器可以辨识的数字信号)
fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。风扇发生故障还会导致temp指示灯发亮。
temp指示灯:当此指示灯发亮时,表明系统温度超出过高。
mem指示灯:当此指示灯发亮时,表明发生内存错误。
nmi指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。
cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误。
cpu指示灯:当此指示灯发亮时,表明某个微处理器出现故障。
vrm指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm出现故障。
dasd指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。
raid指示灯:当此指示灯发亮时,表明阵列卡故障。
brd指示灯:当此指示灯发亮时,表明某个连接的i/o扩展单元出现故障。

通常一个节点的内存在250G左右,若不设置运行内存,则会默认250G,当设置核心数过少时,可能会被分配到某个含空闲核心数不多的节点,该节点内存亦不多,因此可能会导致任务被杀死,下图所示

因此一般需要配置使用内存,可同时配置软件的使用内存和服务器请求使用的内存

可增加核心数,并在配置文件中配置使用内存,如50G,则在Max memory输入50

1)指定作业设置最大内存:--mem=<size[units]>指定作业在每个节点申请的内存

2)每个进程设置最大内存:--mem-per-cpu=<size[units]> 每个进程申请的内存

结果显示节点名、节点状态、剩余CPU(核心数)、CPUload(一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息)、节点内存大小,剩余节点内存,任务列表

查看

参考:
>大致结果类似下图:

Mem行(单位均为M):

(-/+ buffers/cache)行:

Swap行指交换分区。

实际上不要看free少就觉得内存不足了,buffers和cached都是可以在使用内存时拿来用的,应该以(-/+ buffers/cache)行的free和used来看。只要没发现swap的使用,就不用太担心,如果swap用了很多,那就要考虑增加物理内存了。

大致结果类似下图:

上方文字部分的红框为总的CPU占用百分率,下方的表格是每个进程的CPU占用率,在表格第一行可以看到红框中占用率超过了150%,这是因为服务器是多核CPU,而该进程使用了多核。

大致结果类似下图:

表格中会显示显卡的一些信息,第一行是版本信息,第二行是标题栏,第三行就是具体的显卡信息了,如果有多个显卡,会有多行,每一行的信息值对应标题栏对应位置的信息。

需要注意的一点是显存占用率和GPU占用率是两个不一样的东西,类似于内存和CPU,两个指标的占用率不一定是互相对应的。

在下面就是每个进程使用的GPU情况了。

大致结果如下图:

表格中每一行代表一个文件系统,各列意义如下:

要查看具体某个文件或者文件夹的大小的话,可以使用下面的命令:

du命令可以查看文件或文件夹的磁盘使用空间,而-h参数的意思是使用GB、MB等易读的格式。如果不带--max-depth参数,那么将循环列出文件夹下所有文件和文件夹占用的空间,带此参数,则是指定深入目录的层数。

如果要看文件夹下所有文件的大小,可以使用:

查看作者首页


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10329887.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-07
下一篇 2023-05-07

发表评论

登录后才能评论

评论列表(0条)

保存