2、BMC固件丢失,无法访问BMC,并可能无法通过远程管理控制台远程管理服务器,重新刷写BMC固件,可以通过硬件连接到服务器或通过远程连接(如果BMC仍然可以通过IP地址访问)来完成。你好,方法如下:
BMC是一个标准,IBM和Dell的服务器标配都有BMC,而且都是和第一个网卡共用的,HP的服务器的iLO是要单独接一根网线用来做远程管理的,这点和DELL的服务器不一样 。只要在BIOS里设置一下IP地址就可以了,也可通过dell的Open Manage设置。或者在linux系统中使用工具设置,将在后面介绍。
BMC的IP地址,在本机上ping本机BMC的IP地址是不通的!在别的服务器上ping才通。
使用Dell的Open Manage设置IPMI时会有提示:
Remote Access management traffic does not function properly when the LAN on Motherboard(LOM)is teamed with any network adapter add-in cardsgigabyte画面是说明你电脑主机的主板是技嘉主板,停留在主板logo界面,你可以尝试按照以下检测及修复方法进行解决:
首先,按Ctrl+Alt+Del键,重启;
然后按照以下方法尝试修复:
1、有些用户所配置的电脑主板加入了许多功能,然而BIOS的设置不正确就会导致电脑启动会导致这个故障
解决办法:恢复BIOS默认值。
开机或者重启电脑按住DEL键或者F1或者F2等等,进入BIOS;
找到 Load Fail-safe Defaults、Load Optmized Defaults、Restore Defaults等类似字样的选项 ,按方向键选中后回车,提示是否确定,按Y,回车。 最后选择Save&exit step(保存设置),直接按F10也可以,按Y回车自动重起,设置生效。
2、排除键盘按键是否因为没有复位引起这个故障
不同电脑相应按键不同,一般为“Delete”“Del”键,可尝试点击“Delete”“Del”键进行复位。
3、没有软驱但启用了软驱,可将软驱禁用。
开机按DEL进BIOS,选择:STANDARD CMOS FEATURES
DRIVE A : 设置为 None
DRIVE B : 设置为 None
按F10 保存,输入“Y”回车即可。
4、原来挂了两个硬盘,在BIOS中设置成了双硬盘,后来拿掉其中一个的时候却忘记将BIOS设置改回来,也会出现这个问题。
只要恢复BIOS默认值即可。
5、内存有问题或者CPU频率被更改,重新插拔内存条或者更换内存条,然后恢复BIOS默认值即可。
6、如果上述设置后无效,也可能是 COMS 电池没有电了,打开主机,抠下纽扣式COMS电池,更换新电池试试。
此外,可能是因为电脑进入系统时,引导介质出错,(即电脑没有识别到你的启动硬盘)
解决办法:
1,在 BIOS 里面设置启动选项,看里面能否找到硬盘,如果能找到,把硬盘改成第一启动就行。如果无法找到,则进入BIOS后,先进Secure菜单,选择Secure Boot Control选项,将其设定为 “Disabled”,然后按F10保存退出。重启再次进入BIOS ,然后在BOOT下将LunchCSM选项设定为Enab led。然后按F10保存退出重启。
2,是否有外接设备,例如优盘之类的,有的话拔掉,重启机器;
3,如果无效,那可能是系统引导文件丢失,请尝试系统恢复,或者建议重装一下系统。
4,如果依旧无效,建议检测下硬盘是否有坏道。
PS:重装系统之前建议确认下是否有设置活动分区,另外注意备份重要文件。
另附:
硬盘检测失败的原因和解决办法:
1、关机断电开机箱,重新插拔硬盘电源线和数据线,再开机,按DEL键(笔记本为F2或其它)进入CMOS,看能否检测到硬盘。如能检测到可用系统U盘启动后使用DISKGEN对其进行检测,重建MBR。如不能,则更换连线或硬盘,并重装系统。
2、开机,按DEL键(笔记本为F2或其它)进入CMOS,找到BOOT选项卡,将硬盘HDD设置为第一启动项。按F10键保存按Y键确定退出重启。
3、如果CMOS中将光盘或U盘启动设置在硬盘启动之前,则需要将插入在光驱或主机USB接口上的非启动光盘或U盘取出。
4、可能原因: 主板BIOS没电,录入不到硬盘信息,如果你的系统日期不正确的话,很可能是这个原因。解决办法:更换BIOS电池,重新进BIOS内检测硬盘。
5、可能原因: IDE线质量不好或插得不牢。解决办法:换一条IDE线或将IDE线插在主板另一个IDE槽里,连硬盘的线不要与其它IDE设备一起连接,例如光驱,分开两条IDE线连,正确设置主/从盘。
6、可能原因: 硬盘故障,可能需要更换。
7、可能原因:如果你的电脑每次都能检测到硬盘而不能进入系统的话,把硬盘重新完全格式化,再重新装系统。(慎用,若有重要资料请做好备份后在行动。)
8、另外设置硬盘启动试试(是不是设置错误)。
9、还有一种情况,内存重新插拔一下、清一下灰也可以解决问题(有时是因为它引起的)。
10、自己解决不了,建议去电脑店请专业维修人员检修。bmc故障处理电路、方法、装置、电子设备及存储介质
技术领域
1本申请涉及通信技术领域,尤其涉及一种bmc故障处理电路、方法、装置、电子设备及存储介质。
背景技术:
2目前,常规的服务器主板上均配置一个bmc控制器,此控制器能够实现服务器的远程监控,但是一旦bmc控制器故障,服务器将无法接收远程监控指令且无法管理服务器内部部件,造成服务器瘫痪死机。
3因此,需要解决因bmc故障导致服务器死机的问题。
4上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
5为了解决上述问题,本申请提供一种bmc故障处理电路、方法、装置、电子设备及存储介质,该电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能。
6本申请第一方面公开一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld;其中,
7bmc与cpld相连;
8cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
9在一种实施方式中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
10在一种实施方式中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
11本申请第二方面公开一种bmc故障处理方法,所述bmc故障处理方法应用于如第一方面任意一项中的bmc故障处理电路中,所述bmc故障处理方法包括:
12cpld判断bmc是否故障;
13cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
14本申请第三方面公开一种bmc故障处理装置,所述bmc故障处理装置包括如第一方面任意一项中的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元;其中,
15所述故障检测单元,用于通过cpld检测bmc是否故障;
16所述处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
17本申请第四方面公开了一种电子设备,所述电子设备包括存储器和处理器;其中,所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如第二方面所述的方法。
18本申请第五方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如第二方面所述的方法。
19本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。
附图说明
20此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
21图1为现有技术中的一种bmc连接电路结构示意图;
22图2为本申请实施例提供的一种bmc故障处理电路结构示意图;
23图3为本申请实施例提供的一种bmc故障处理方法流程示意图;
24图4为本申请实施例提供的一种bmc故障处理装置结构示意图。
具体实施方式
25为了更清楚的阐释本申请的整体构思,下面结合说明书附图以示例的方式进行详细说明。
26本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的顺序在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
27此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28本申请中cpld,特指服务器主板上已有的cpld控制器,常规作用是负责服务器电源上电管理;bmc(baseboard management controller),负责服务器的部件管理和远程监控;服务器是计算机的一种,比普通计算机运行更快、负载更高。
29图1中是现有技术。通讯信号线为多个信号线组,在该架构方案中,如果bmc发生故障,则服务器无法实现远程监控,bmc将服务管理部分部件,服务器将会瘫痪死机。
30故本说明书公开了一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld。如图2所示。
31bmc与cpld相连;cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
32在一个示例中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
33在一个示例中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
34如图2中,通讯信号线为多个信号线组,对应的切换开关也有多个,实现对通讯信号线组的切换,本说明书以1个切换控制信号进行说明。cpld通过bmc故障信号线判断bmc是否发生故障,如果bmc未发生故障,则控制切换开关使得cpu及待管理部件的通讯信号线连接至bmc控制器;如果bmc发生故障,则控制电子切换开关使得cpu及待管理部件的通讯信号线连接至cpld,由cpld进行服务器的管理和配置以及外接以太网接口实现服务器的远程监控。
35此时,把服务器cpu与主要部件原有接入bmc的通讯信号经信号切换开关分出另外一组通讯支路至cpld;bmc正常工作时,信号切换开关切换通讯通道至bmc;如果bmc故障,cpld控制信号切换开关切换通讯通道至cpld,由cpld接管管理和配置服务器的功能。
36本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。也就是,本申请增加系统链路通道,防止bmc处由于单一设备故障造成的服务器系统瘫痪,增加系统容错能力,提高服务器稳定性。
37本说明书的方案改变以往的仅能通过bmc管理和配置服务器的方式,增加通过cpld控制器管理和配置服务器的方式,解决bmc控制器故障带来的服务器无法远程监控以及瘫痪死机的问题。相当于增加服务器管理和配置的方式,通过cpld建立起另外一个服务器管理和交互的通道,对bmc起到冗余备份的作用。
38此时,在现有主板cpld控制器的基础上扩展通讯接口,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路简单管理服务器的功能。由于cpld配置和管理服务器没有bmc管理那么完善,实现一些必要的远程维护和设备管理配置即可,以免耽误服务器使用;后续再详细检修或更换bmc控制器。
39本说明书还公开了一种bmc故障处理方法,所述bmc故障处理方法应用于如上所述的bmc故障处理电路中,所述bmc故障处理方法包括步骤s301
‑
s302。
40s301、cpld判断bmc是否故障。
41s302、cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
42在一个示例中,若cpld确定bmc故障,则所述cpld控制电子切换开关的一端与所述cpld相连。
43在一个示例中,若cpld确定bmc正常,则所述cpld控制电子切换开关的一端与所述bmc相连。
44上述方法实施例中,与上述电路实施例中相同或相近之处,不再赘述。
45本说明书还公开了一种bmc故障处理装置,所述bmc故障处理装置包括如上所述的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元。如图4所示。
46故障检测单元,用于通过cpld检测bmc是否故障;
47处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
48在一个示例中,当所述故障检测单元确定所述bmc故障时,所述处理单元控制电子
切换开关的一端与所述cpld连接;或当所述故障检测单元确定所述bmc正常时,所述处理单元控制电子切换开关的一端与所述bmc连接。
49上述装置实施例中,与上述电路实施例中相同或相近之处,不再赘述。
50本说明书还公开了一种电子设备,所述电子设备包括存储器和处理器。所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如上所述的方法。
51本说明书还公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如上所述的方法。
52本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
53专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
54以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。是。通过bmc对服务器主板多个功能芯片进行固件烧录,属于服务器技术领域。BMC,执行伺服器远端管理控制器,英文全称为BaseboardManagementController为基板管理控制器。命令需要使用root权限才能使用,其中- H为需要 *** 作的BMC ip,-I lanplus为使用rmcp+协议发送命令,-U 为 *** 作命令的用户名,-P为用户密码。
1、查询所有用户
ipmitool -H 10101010 -I lanplus -U root -P admin user list
ID Name Callin Link Auth IPMI Msg Channel Priv Limit
1 true true true NO ACCESS
2 root true true true ADMINISTRATOR
3 true true true NO ACCESS
4 true true true NO ACCESS
5 true true true NO ACCESS
2、新增用户用户名和用户id不能和已有用户名用户id重复,如用户名test3,用户id为3
ipmitool -H 10101010 -I lanplus -U root -P admin user set name 3 test3
3密码需要满足复杂度要求,如设置用户id为3的密码
ipmitool -H 10101010 -I lanplus -U root -P admin user set password 3 test3
4、权限取值范围2:USER,3:OPERATOR,4:ADMINISTRATOR,用户创建后的默认权限为NO ACCESS,没有访问权限。如设置用户id为3的权限,设置完成即可使用用户名密码访问BMC
ipmitool -H 10101010 -I lanplus -U root -P admin user priv 3 4
5、使能id为3的用户
ipmitool -H 10101010 -I lanplus -U root -P admin user enabled 3是网口。BMC其实是一个单片机,它有自己独立的IO设备,而独立网口就是其中之一。IPMI15允许IPMI系统通过串口,BMC专用的带外网口,或者与主机共享的带内网口(NC-SI)与远程管理系统通讯。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)