技术领域
1本申请涉及通信技术领域,尤其涉及一种bmc故障处理电路、方法、装置、电子设备及存储介质。
背景技术:
2目前,常规的服务器主板上均配置一个bmc控制器,此控制器能够实现服务器的远程监控,但是一旦bmc控制器故障,服务器将无法接收远程监控指令且无法管理服务器内部部件,造成服务器瘫痪死机。
3因此,需要解决因bmc故障导致服务器死机的问题。
4上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
5为了解决上述问题,本申请提供一种bmc故障处理电路、方法、装置、电子设备及存储介质,该电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能。
6本申请第一方面公开一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld;其中,
7bmc与cpld相连;
8cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
9在一种实施方式中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
10在一种实施方式中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
11本申请第二方面公开一种bmc故障处理方法,所述bmc故障处理方法应用于如第一方面任意一项中的bmc故障处理电路中,所述bmc故障处理方法包括:
12cpld判断bmc是否故障;
13cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
14本申请第三方面公开一种bmc故障处理装置,所述bmc故障处理装置包括如第一方面任意一项中的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元;其中,
15所述故障检测单元,用于通过cpld检测bmc是否故障;
16所述处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
17本申请第四方面公开了一种电子设备,所述电子设备包括存储器和处理器;其中,所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如第二方面所述的方法。
18本申请第五方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如第二方面所述的方法。
19本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。
附图说明
20此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
21图1为现有技术中的一种bmc连接电路结构示意图;
22图2为本申请实施例提供的一种bmc故障处理电路结构示意图;
23图3为本申请实施例提供的一种bmc故障处理方法流程示意图;
24图4为本申请实施例提供的一种bmc故障处理装置结构示意图。
具体实施方式
25为了更清楚的阐释本申请的整体构思,下面结合说明书附图以示例的方式进行详细说明。
26本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的顺序在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
27此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28本申请中cpld,特指服务器主板上已有的cpld控制器,常规作用是负责服务器电源上电管理;bmc(baseboard management controller),负责服务器的部件管理和远程监控;服务器是计算机的一种,比普通计算机运行更快、负载更高。
29图1中是现有技术。通讯信号线为多个信号线组,在该架构方案中,如果bmc发生故障,则服务器无法实现远程监控,bmc将服务管理部分部件,服务器将会瘫痪死机。
30故本说明书公开了一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld。如图2所示。
31bmc与cpld相连;cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
32在一个示例中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
33在一个示例中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
34如图2中,通讯信号线为多个信号线组,对应的切换开关也有多个,实现对通讯信号线组的切换,本说明书以1个切换控制信号进行说明。cpld通过bmc故障信号线判断bmc是否发生故障,如果bmc未发生故障,则控制切换开关使得cpu及待管理部件的通讯信号线连接至bmc控制器;如果bmc发生故障,则控制电子切换开关使得cpu及待管理部件的通讯信号线连接至cpld,由cpld进行服务器的管理和配置以及外接以太网接口实现服务器的远程监控。
35此时,把服务器cpu与主要部件原有接入bmc的通讯信号经信号切换开关分出另外一组通讯支路至cpld;bmc正常工作时,信号切换开关切换通讯通道至bmc;如果bmc故障,cpld控制信号切换开关切换通讯通道至cpld,由cpld接管管理和配置服务器的功能。
36本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。也就是,本申请增加系统链路通道,防止bmc处由于单一设备故障造成的服务器系统瘫痪,增加系统容错能力,提高服务器稳定性。
37本说明书的方案改变以往的仅能通过bmc管理和配置服务器的方式,增加通过cpld控制器管理和配置服务器的方式,解决bmc控制器故障带来的服务器无法远程监控以及瘫痪死机的问题。相当于增加服务器管理和配置的方式,通过cpld建立起另外一个服务器管理和交互的通道,对bmc起到冗余备份的作用。
38此时,在现有主板cpld控制器的基础上扩展通讯接口,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路简单管理服务器的功能。由于cpld配置和管理服务器没有bmc管理那么完善,实现一些必要的远程维护和设备管理配置即可,以免耽误服务器使用;后续再详细检修或更换bmc控制器。
39本说明书还公开了一种bmc故障处理方法,所述bmc故障处理方法应用于如上所述的bmc故障处理电路中,所述bmc故障处理方法包括步骤s301
‑
s302。
40s301、cpld判断bmc是否故障。
41s302、cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
42在一个示例中,若cpld确定bmc故障,则所述cpld控制电子切换开关的一端与所述cpld相连。
43在一个示例中,若cpld确定bmc正常,则所述cpld控制电子切换开关的一端与所述bmc相连。
44上述方法实施例中,与上述电路实施例中相同或相近之处,不再赘述。
45本说明书还公开了一种bmc故障处理装置,所述bmc故障处理装置包括如上所述的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元。如图4所示。
46故障检测单元,用于通过cpld检测bmc是否故障;
47处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
48在一个示例中,当所述故障检测单元确定所述bmc故障时,所述处理单元控制电子
切换开关的一端与所述cpld连接;或当所述故障检测单元确定所述bmc正常时,所述处理单元控制电子切换开关的一端与所述bmc连接。
49上述装置实施例中,与上述电路实施例中相同或相近之处,不再赘述。
50本说明书还公开了一种电子设备,所述电子设备包括存储器和处理器。所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如上所述的方法。
51本说明书还公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如上所述的方法。
52本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
53专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
54以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。如果在超威服务器 BMC(Baseboard Management Controller)更新过程中遇到断电等异常情况,可能会导致 BMC 固件损坏或无法正常工作。在这种情况下,建议按照以下步骤进行处理:
尝试重新启动服务器:首先,将服务器断电,等待数秒钟后再重新通电,然后尝试启动服务器,看是否能够正常工作。如果服务器能够正常启动,可以尝试重新进行 BMC 固件更新。
使用 BMC 恢复工具进行修复:如果服务器无法正常启动或者 BMC 仍然无法正常工作,可以尝试使用超威提供的 BMC 恢复工具进行修复。具体 *** 作方法和工具下载链接可以在超威官方网站上找到。
联系超威技术支持:如果以上方法都无法解决问题,建议联系超威技术支持寻求进一步的帮助和支持。
需要注意的是,在进行 BMC 更新等重要 *** 作时,建议提前备份数据和设置,以便在出现异常情况时能够快速恢复系统。同时,也建议在更新 BMC 前仔细阅读相关文档,并确保 *** 作正确、稳定。1、首先在戴尔530服务器上找到BMC卡。
2、其次连接BMC卡,通过另一台电脑使用IPMI工具连接到服务器。
3、然后登录IPMI工具管理界面,进入节点图形界面。
4、最后单击“Configuration”中的管理员账户就可以重置密码了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)