一般在网络服务器上有一个BMC来监控系统,报告系统软件的物理状况,以保证网络服务器的持续稳定运行。由于BMC本身是由硬件配置、计算机 *** 作系统、监控应用软件组成的软硬件系统软件,也很可能产生常见故障,甚至导致其无法响应系统软件发送的IPMI要求,说白了就是BMC hang。那么,可以采取什么对策来尝试修复BMC中的挂机场景呢?
首先,您可以尝试在服务器主机上再次加载BMC驱动器,并且可以运行以下命令来检查IPMI驱动器之前是否已经加载过:
[root@localhost ~]#lsmod|grep "IPMI"
如果这个命令返回空,说明现在的电脑 *** 作系统还没有加载IPMI所依赖的驱动程序,必须手动加载。否则,你可以先
Rmmod删除前一个驱动器,然后参考以下命令再次加载它:
[root@localhost
~]#CD/usr/lib/modules/3.10.0
3.10.0/
3.10.0-229.el7.x86_64/
[root@localhost
~]#CD
/usr/lib/modules/3.10.0-229.el7.x86_64/kernel/drivers/char/IPMI/[/IPMI
[root@localhost
IPMI]#modprobeIPMI_devintf
[root@localhost
IPMI]#modprobeIPMI_si
[root@localhost
IPMI]#modprobeIPMI_msghandler
您
有新邮件在/var/spool/mail/root
[root@localhost
IPMI]#modprobeIPMI_power
[root@localhost
IPMI]#lsmod|grep"IPMI"
IPMI_watchdog
249120
IPMI_poweroff
143660
IPMI_si
533532
IPMI_devintf
175720
IPMI_msghandler
最后,您可以运行一些IPMI命令来进一步验证IPMI是否工作:
[root@localhost
IPMI]#ipmitoolselelist
1|2015年12月29日|06:51:39|
处理器|配置错误|断言
2|
2015年12月29日|06:55:26|处理器|配置错误|断言
3|2015年12月29日|06:55:26
如果以上方法不能解决困难,可能是KCS插座挂机卡死了,可以参考以下方法。
其次,你可以尝试根据互联网局域网接口重启BMC。
比如有一个网络服务器,其BMC
IP为192.168.1.95,已经配备了远程控制客户端和登录密码,允许登录。然后尝试以下命令重启BMC:
[root@localhost
~]#ipmitool-Ilanplus-h192.168.1.95-uadmin-padminMCreset
cold
sent
sent。
如果BMC可以重启,然后在服务器上运行IPMI命令,看看命令是否可以运行。如果它可以运行,这意味着KCS插座已经处于良好状态。
其次,可以考虑BMC系统软件完全断电后再通电。一般MC可以控制主机的上电和断电,除非切断交流电源(开关电源拔掉),否则一直处于上电状态。因此,此时必须拔掉所有BMC和主机服务器的交流开关电源,过一会儿再通电。系统软件启动后,运行IPMI命令查看BMC是否正常。如果一切正常,说明BMC经过AC 周期后已经修复。
最后可以连接BMC的输出串行通讯,检查其是否有输出,以及重新上电后输出停留的区域。因此,准确定位BMC无法启动的地点的常见原因包括:
1. BMC夹具被意外更改;
2.Watchdog1的请求超时设置很小,一个启动项耗时太长,导致不断重启、请求超时、重启。.....
3. BMC固件升级或不断升级。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)