浪潮NF5280M4
RAID卡 3008 (CTRL+I进入配置)
软件环境:
CentOS-7-x86_64-DVD-2003(原服务器系统)注:不知道代理商用的什么驱动,居然能识别板载RAID卡。
重做系统版本:Centos610
因为系统出故障,打算重装系统,这期间碰到的重装问题进行整理。以供同仁参考。
1BIOS设备BMC静态地址和掩码,网关可以不设置(F2进入BIOS);
在这里插入描述
2笔记本与服务器IPMI端口,网线直连;
3笔记本设备和BMC同网段地址;
4windows系统关掉防火墙;
5测试ping 服务器BMC管理地址是否畅通;
6注意使用浏览器谷歌和IE,如果多次打不开BMC地址,修复浏览器清理缓存,或重启服务器和笔记本;
7BMC安装系统有两种方式,HTML5网页版和JAVA版,HTML5需要浏览器支持(BMC下没有HTML5选项的,用JAVA方式),不支持的使用JAVA版安装系统,其他看官方手册安装即可。
在这里插入描述
BMC JAVA方式安装
8d出JAVA程序下载运行,会有安全级别提醒,把“管理地址+端口”添加进例外,修改完后进入正常 *** 作界面。
在这里插入描述
在这里插入描述
在这里插入描述
正常 *** 作界面
9浪潮服务器不管是BMC和U盘镜像重装系统时要注意版本是否和原系统匹配,不然会出现RAID驱动不配套,因为找不到磁盘,会出现下图问题。网上说的其他解决方法都忽略这方面问题,导致我在这个问题打转转。BMC管理服务器是一种用于管理网络设备的服务器,它可以用来监控设备的状态,控制设备的功能,远程控制设备,收集网络设备的性能数据,以及提供安全服务。没有BMC管理服务器,网络管理人员将无法对网络设备进行远程管理和监控,也无法收集网络设备的性能数据,从而降低网络管理人员的工作效率,影响网络的稳定性和安全性。UCE错误。华为服务器bmc日志内存故障通常是因为DIMM4内存条发生UCE错误导致的,需要用户立即进行检查拔插或者更换故障DIMM4内存条即可。DIMM中文名叫双列直插式存储模块,是指奔腾CPU推出后出现的新型内存条,它提供了64位的数据通道。服务器的主板出现异常。
>浪潮bmc升级后起不来有几种原因:
1、内存故障。
2、电源功率不足。
3、电压不稳。
4、硬盘有坏道。
5、散热风扇损坏。
6、内存资源冲突。
7、病毒。
8、运行软件死机。有这些问题浪潮bmc升级后起不来。如果您忘记了您的华为服务器的BMCIP地址,则可以尝试以下步骤来找回:
1 查找系统文档或包装箱上的标签,它可能包含BMC IP的信息。
2 如果您可以登录到服务器 *** 作系统,则可以尝试使用命令“ipmitool lan print”查找BMC IP地址。
3 如果您无法访问服务器 *** 作系统,则可以通过连接到服务器的控制台并按下特定按键来重置BMC IP地址。这些按键可能因服务器型号而异,因此请参考服务器文档以了解详细信息。
4 如果以上方法都不起作用,那么您可能需要使用一些专业工具来重置BMC IP地址,例如使用Serial over LAN(SOL)功能,或者您可以联系服务器厂商寻求帮助。
总之,忘记BMC IP地址是一个比较常见的问题,但有多种解决方案可供尝试,具体取决于您的具体情况。bmc故障处理电路、方法、装置、电子设备及存储介质
技术领域
1本申请涉及通信技术领域,尤其涉及一种bmc故障处理电路、方法、装置、电子设备及存储介质。
背景技术:
2目前,常规的服务器主板上均配置一个bmc控制器,此控制器能够实现服务器的远程监控,但是一旦bmc控制器故障,服务器将无法接收远程监控指令且无法管理服务器内部部件,造成服务器瘫痪死机。
3因此,需要解决因bmc故障导致服务器死机的问题。
4上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
5为了解决上述问题,本申请提供一种bmc故障处理电路、方法、装置、电子设备及存储介质,该电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能。
6本申请第一方面公开一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld;其中,
7bmc与cpld相连;
8cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
9在一种实施方式中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
10在一种实施方式中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
11本申请第二方面公开一种bmc故障处理方法,所述bmc故障处理方法应用于如第一方面任意一项中的bmc故障处理电路中,所述bmc故障处理方法包括:
12cpld判断bmc是否故障;
13cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
14本申请第三方面公开一种bmc故障处理装置,所述bmc故障处理装置包括如第一方面任意一项中的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元;其中,
15所述故障检测单元,用于通过cpld检测bmc是否故障;
16所述处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
17本申请第四方面公开了一种电子设备,所述电子设备包括存储器和处理器;其中,所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如第二方面所述的方法。
18本申请第五方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如第二方面所述的方法。
19本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。
附图说明
20此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
21图1为现有技术中的一种bmc连接电路结构示意图;
22图2为本申请实施例提供的一种bmc故障处理电路结构示意图;
23图3为本申请实施例提供的一种bmc故障处理方法流程示意图;
24图4为本申请实施例提供的一种bmc故障处理装置结构示意图。
具体实施方式
25为了更清楚的阐释本申请的整体构思,下面结合说明书附图以示例的方式进行详细说明。
26本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的顺序在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
27此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28本申请中cpld,特指服务器主板上已有的cpld控制器,常规作用是负责服务器电源上电管理;bmc(baseboard management controller),负责服务器的部件管理和远程监控;服务器是计算机的一种,比普通计算机运行更快、负载更高。
29图1中是现有技术。通讯信号线为多个信号线组,在该架构方案中,如果bmc发生故障,则服务器无法实现远程监控,bmc将服务管理部分部件,服务器将会瘫痪死机。
30故本说明书公开了一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld。如图2所示。
31bmc与cpld相连;cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
32在一个示例中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
33在一个示例中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
34如图2中,通讯信号线为多个信号线组,对应的切换开关也有多个,实现对通讯信号线组的切换,本说明书以1个切换控制信号进行说明。cpld通过bmc故障信号线判断bmc是否发生故障,如果bmc未发生故障,则控制切换开关使得cpu及待管理部件的通讯信号线连接至bmc控制器;如果bmc发生故障,则控制电子切换开关使得cpu及待管理部件的通讯信号线连接至cpld,由cpld进行服务器的管理和配置以及外接以太网接口实现服务器的远程监控。
35此时,把服务器cpu与主要部件原有接入bmc的通讯信号经信号切换开关分出另外一组通讯支路至cpld;bmc正常工作时,信号切换开关切换通讯通道至bmc;如果bmc故障,cpld控制信号切换开关切换通讯通道至cpld,由cpld接管管理和配置服务器的功能。
36本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。也就是,本申请增加系统链路通道,防止bmc处由于单一设备故障造成的服务器系统瘫痪,增加系统容错能力,提高服务器稳定性。
37本说明书的方案改变以往的仅能通过bmc管理和配置服务器的方式,增加通过cpld控制器管理和配置服务器的方式,解决bmc控制器故障带来的服务器无法远程监控以及瘫痪死机的问题。相当于增加服务器管理和配置的方式,通过cpld建立起另外一个服务器管理和交互的通道,对bmc起到冗余备份的作用。
38此时,在现有主板cpld控制器的基础上扩展通讯接口,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路简单管理服务器的功能。由于cpld配置和管理服务器没有bmc管理那么完善,实现一些必要的远程维护和设备管理配置即可,以免耽误服务器使用;后续再详细检修或更换bmc控制器。
39本说明书还公开了一种bmc故障处理方法,所述bmc故障处理方法应用于如上所述的bmc故障处理电路中,所述bmc故障处理方法包括步骤s301
‑
s302。
40s301、cpld判断bmc是否故障。
41s302、cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
42在一个示例中,若cpld确定bmc故障,则所述cpld控制电子切换开关的一端与所述cpld相连。
43在一个示例中,若cpld确定bmc正常,则所述cpld控制电子切换开关的一端与所述bmc相连。
44上述方法实施例中,与上述电路实施例中相同或相近之处,不再赘述。
45本说明书还公开了一种bmc故障处理装置,所述bmc故障处理装置包括如上所述的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元。如图4所示。
46故障检测单元,用于通过cpld检测bmc是否故障;
47处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
48在一个示例中,当所述故障检测单元确定所述bmc故障时,所述处理单元控制电子
切换开关的一端与所述cpld连接;或当所述故障检测单元确定所述bmc正常时,所述处理单元控制电子切换开关的一端与所述bmc连接。
49上述装置实施例中,与上述电路实施例中相同或相近之处,不再赘述。
50本说明书还公开了一种电子设备,所述电子设备包括存储器和处理器。所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如上所述的方法。
51本说明书还公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如上所述的方法。
52本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
53专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
54以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)