监视Linux上的物理RAM错误

监视Linux上的物理RAM错误,第1张

概述我想监视两个 Linux系统(Ubuntu和Red Hat)的内存.我意识到我可以从启动运行memtest86来诊断坏ram.但是在系统仍在运行时是否有任何监控RAM的解决方案.我在想一个守护进程,它从随机未使用的内存中写入和读回.以前有人见过这样的东西吗? 大多数具有任何合理质量的现代服务器都有一个IPMI模块,它会报告坏的RAM(通常是通过来自ECC RAM的SBE(单比特错误)消息 – 你在 我想监视两个 Linux系统(Ubuntu和Red Hat)的内存.我意识到我可以从启动运行memtest86来诊断坏ram.但是在系统仍在运行时是否有任何监控RAM的解决方案.我在想一个守护进程,它从随机未使用的内存中写入和读回.以前有人见过这样的东西吗?解决方法 大多数具有任何合理质量的现代服务器都有一个IPMI模块,它会报告坏的RAM(通常是通过来自ECC RAM的SBE(单比特错误)消息 – 你在服务器中使用ECC RAM,对吗?). IPMI模块还监视和报告一堆其他有用的东西.

您可以使用各种网络监视系统(如果您有IPMI NIC的管理网络)或使用大多数Unix系统上提供的ipmitool来监视IPMI模块.许多供应商(戴尔和IBM肯定)也有专门的工具来询问IPMI模块的在线诊断.有关详细信息,请咨询硬件供应商.

总结

以上是内存溢出为你收集整理的监视Linux上的物理RAM错误全部内容,希望文章能够帮你解决监视Linux上的物理RAM错误所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/1033784.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-24
下一篇 2022-05-24

发表评论

登录后才能评论

评论列表(0条)

保存