Linux服务器EDAC CE memory read error

Linux服务器EDAC CE memory read error,第1张

之前在大数据集群中,有一台服务器的CPU占用总是莫名其妙飙高,就算执行简单任务也会耗费很长时间,且reboot不能解决问题。检查了各种可能的问题之后,最终在查看 dmesg 命令的设备信息时,发现大量如下的日志: EDAC即error detection and correction(错误检测与纠正),是Linux系统内部的机制。在上面的日志中,可以清楚地看出是内存读错误。MC即memory controller(内存控制器)。CE则代表correctable error,是ECC内存中可以纠正的错误,相对地还有UE(uncorrectable error)。 为了摸清是哪些内存出了问题,找出所有内存的CE计数: 可见是mc1/csrow1/ch0和mc1/csrow1/ch1两个通道上的内存出了问题。mc、csrow(chip-select row)与ch之间的关系类似下图: 通过 dmidecode -t memory 命令,可以查看每个DIMM(也就是常说的内存条)对应的位置。然后根据映射关系,去服务器上将出现问题的两根内存条更换,问题就解决了。

方法1、查看内存(RAM)情况最简单的方法是通过 /proc/meminfo。

打开命令界面,用ctrl+alt+f1可以进入命令界面

在命令界面输入:cat /proc/meminfo

方法2、还可以通过GNOME System Monitor查看

打开命令界面,用ctrl+alt+f1可以进入命令界面

在命令界面输入: gnome-system-monitor


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8890681.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存