定制服务器都是怎么设计出来的啊?

定制服务器都是怎么设计出来的啊?,第1张

一般来说,定制服务器主要是在于以下四点的设计:

1、共享组件

出于资源利用及节能需求,服务器在定制化过程中通常可以采用共享组件的方式提升空间资源的利用率,从而降低能耗,类似的做法包括将多个服务器节点置于同一机箱空间内、多个服务器共享风扇及电源组件等。例如在4U空间内集成8 台1U服务器或4 台2U服务器,并实现电源及风扇的共享使用,较传统机架服务器部署密度提升,能耗降低,同时建造成本也下降了。

2、整合接口

为了进一步提升服务器内部线路及空间资源的利用率,服务器定制化过程中可以将一些常用的接口,如对USB、VGA等进行集成整合,形成统一的标准化接口。

3、按需配置部件

不同数据中心面向的用户群体不同,这导致其承担的业务负载有所差异。比如说互联网数据中心的业务一般单一且规模较大,因此服务器可以按照单一应用来深度定制。而对于大部分运营商来说,其数据中心面临的业务则较为分散,长词需要同时处理人工智能、Web、视频等多种类型的应用服务,在这种情况下,数据中心需要面向不同应用部署相应的定制化服务器。

在服务器定制化过程中,数据中心可以根据业务对资源的需求及服务级别协议的要求对服务器CPU、内存、IO、网卡及硬盘等部件进行针对性的配置,适当减少利用率较低的硬件资源,增加业务负载需求量较大的资源,从而防止资源的过度配置,同时避免了某些资源配置不足造成资源瓶颈。

4、按需定制软硬件

在外部政策及企业内部控制制度制约下,数据中心会产生某些特定的运维管理需求,这类需求实际上形成了对服务器原有功能的拓展,部分拓展功能的实现需要定制化的软件及硬件支持。例如,不少数据中心用户希望实现对服务器的远程管理,以此进一步降低数据中心运营管理成本、提升运营效率,并且在恶劣天气、当下疫情等不良的外部环境下,服务器远程管理功能能够降低运维人员外出工作的安全风险。为了满足这种特定的功能需求,定制化服务器可以实现智能平台管理接口开放,部署相应的远程管理工具,同时根据软件功能需求对底层硬件进行定制,如基板管理控制器BMC的定制等。

参考链接:定制服务器有哪些关键技术?

1首先给自己电脑有线网卡配一个IP地址
浪潮服务器通过DHCP获取地址进入IPMI,BMC管理后台的方法,可实现远程安装系统、温度运行状态监测、风扇转速调整、远程开关机、KVM控制台显示器等功能
2然后用网线连接服务器IPMI口,连接服务器IPMI口,连接服务器IPMI口和笔记本的有线网口
3打开深度远程启动管理器配置DHCP
浪潮服务器通过DHCP获取地址进入IPMI,BMC管理后台的方法,可实现远程安装系统、温度运行状态监测、风扇转速调整、远程开关机、KVM控制台显示器等功能
4选择 刚才配的IP!,刚才配的IP!,刚才配的IP!
注意一下,必须要,插上网线!,插上网线!,插上网线! 以后才会显示 刚才配过的IP,
浪潮服务器通过DHCP获取地址进入IPMI,BMC管理后台的方法,可实现远程安装系统、温度运行状态监测、风扇转速调整、远程开关机、KVM控制台显示器等功能
5点击下这个按钮开启DHCP服务
浪潮服务器通过DHCP获取地址进入IPMI,BMC管理后台的方法,可实现远程安装系统、温度运行状态监测、风扇转速调整、远程开关机、KVM控制台显示器等功能
如果图标是灰色 代表DHCP已经在运行了,先点一下红色的停止服务,再点蓝色图标 ,以重新启动DHCP服务
浪潮服务器通过DHCP获取地址进入IPMI,BMC管理后台的方法,可实现远程安装系统、温度运行状态监测、风扇转速调整、远程开关机、KVM控制台显示器等功能
6在右下“日志信息”中可以看到服务器获取到了一个IP地址,在浏览器中输入这个地址就能访问服务器BMC管理后台了

BMC管理服务器是一种用于管理网络设备的服务器,它可以用来监控设备的状态,控制设备的功能,远程控制设备,收集网络设备的性能数据,以及提供安全服务。没有BMC管理服务器,网络管理人员将无法对网络设备进行远程管理和监控,也无法收集网络设备的性能数据,从而降低网络管理人员的工作效率,影响网络的稳定性和安全性。

是。通过bmc对服务器主板多个功能芯片进行固件烧录,属于服务器技术领域。BMC,执行伺服器远端管理控制器,英文全称为BaseboardManagementController为基板管理控制器。

bmc故障处理电路、方法、装置、电子设备及存储介质
技术领域
1本申请涉及通信技术领域,尤其涉及一种bmc故障处理电路、方法、装置、电子设备及存储介质。
背景技术:
2目前,常规的服务器主板上均配置一个bmc控制器,此控制器能够实现服务器的远程监控,但是一旦bmc控制器故障,服务器将无法接收远程监控指令且无法管理服务器内部部件,造成服务器瘫痪死机。
3因此,需要解决因bmc故障导致服务器死机的问题。
4上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
5为了解决上述问题,本申请提供一种bmc故障处理电路、方法、装置、电子设备及存储介质,该电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能。
6本申请第一方面公开一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld;其中,
7bmc与cpld相连;
8cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
9在一种实施方式中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
10在一种实施方式中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
11本申请第二方面公开一种bmc故障处理方法,所述bmc故障处理方法应用于如第一方面任意一项中的bmc故障处理电路中,所述bmc故障处理方法包括:
12cpld判断bmc是否故障;
13cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
14本申请第三方面公开一种bmc故障处理装置,所述bmc故障处理装置包括如第一方面任意一项中的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元;其中,
15所述故障检测单元,用于通过cpld检测bmc是否故障;
16所述处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
17本申请第四方面公开了一种电子设备,所述电子设备包括存储器和处理器;其中,所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如第二方面所述的方法。
18本申请第五方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如第二方面所述的方法。
19本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。
附图说明
20此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
21图1为现有技术中的一种bmc连接电路结构示意图;
22图2为本申请实施例提供的一种bmc故障处理电路结构示意图;
23图3为本申请实施例提供的一种bmc故障处理方法流程示意图;
24图4为本申请实施例提供的一种bmc故障处理装置结构示意图。
具体实施方式
25为了更清楚的阐释本申请的整体构思,下面结合说明书附图以示例的方式进行详细说明。
26本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的顺序在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
27此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28本申请中cpld,特指服务器主板上已有的cpld控制器,常规作用是负责服务器电源上电管理;bmc(baseboard management controller),负责服务器的部件管理和远程监控;服务器是计算机的一种,比普通计算机运行更快、负载更高。
29图1中是现有技术。通讯信号线为多个信号线组,在该架构方案中,如果bmc发生故障,则服务器无法实现远程监控,bmc将服务管理部分部件,服务器将会瘫痪死机。
30故本说明书公开了一种bmc故障处理电路,所述bmc故障处理电路包括cpu及待管理部件、bmc和cpld。如图2所示。
31bmc与cpld相连;cpu及待管理部件与电子切换开关的一端相连,电子切换开关的另一端与所述bmc或者所述cpld相连。
32在一个示例中,所述cpld确定所述bmc故障,所述cpld控制所述电子切换开关的一端与所述cpld相连。
33在一个示例中,所述cpld确定所述bmc正常,所述cpld控制所述电子切换开关的一端与所述bmc相连。
34如图2中,通讯信号线为多个信号线组,对应的切换开关也有多个,实现对通讯信号线组的切换,本说明书以1个切换控制信号进行说明。cpld通过bmc故障信号线判断bmc是否发生故障,如果bmc未发生故障,则控制切换开关使得cpu及待管理部件的通讯信号线连接至bmc控制器;如果bmc发生故障,则控制电子切换开关使得cpu及待管理部件的通讯信号线连接至cpld,由cpld进行服务器的管理和配置以及外接以太网接口实现服务器的远程监控。
35此时,把服务器cpu与主要部件原有接入bmc的通讯信号经信号切换开关分出另外一组通讯支路至cpld;bmc正常工作时,信号切换开关切换通讯通道至bmc;如果bmc故障,cpld控制信号切换开关切换通讯通道至cpld,由cpld接管管理和配置服务器的功能。
36本申请的电路在bmc故障时,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路管理服务器的功能;从而解决bmc故障时造成服务器无法远程监控以及瘫痪死机的问题。也就是,本申请增加系统链路通道,防止bmc处由于单一设备故障造成的服务器系统瘫痪,增加系统容错能力,提高服务器稳定性。
37本说明书的方案改变以往的仅能通过bmc管理和配置服务器的方式,增加通过cpld控制器管理和配置服务器的方式,解决bmc控制器故障带来的服务器无法远程监控以及瘫痪死机的问题。相当于增加服务器管理和配置的方式,通过cpld建立起另外一个服务器管理和交互的通道,对bmc起到冗余备份的作用。
38此时,在现有主板cpld控制器的基础上扩展通讯接口,实现cpld对服务器的管理和配置,进而实现bmc故障下通过cpld链路简单管理服务器的功能。由于cpld配置和管理服务器没有bmc管理那么完善,实现一些必要的远程维护和设备管理配置即可,以免耽误服务器使用;后续再详细检修或更换bmc控制器。
39本说明书还公开了一种bmc故障处理方法,所述bmc故障处理方法应用于如上所述的bmc故障处理电路中,所述bmc故障处理方法包括步骤s301

s302。
40s301、cpld判断bmc是否故障。
41s302、cpld根据bmc是否故障,控制电子切换开关的一端与所述bmc相连或者所述cpld相连。
42在一个示例中,若cpld确定bmc故障,则所述cpld控制电子切换开关的一端与所述cpld相连。
43在一个示例中,若cpld确定bmc正常,则所述cpld控制电子切换开关的一端与所述bmc相连。
44上述方法实施例中,与上述电路实施例中相同或相近之处,不再赘述。
45本说明书还公开了一种bmc故障处理装置,所述bmc故障处理装置包括如上所述的bmc故障处理电路,所述bmc故障处理装置包括故障检测单元和处理单元。如图4所示。
46故障检测单元,用于通过cpld检测bmc是否故障;
47处理单元,根据所述故障检测单元的检测结果,控制电子切换开关的一端与所述bmc连接或者所述cpld连接。
48在一个示例中,当所述故障检测单元确定所述bmc故障时,所述处理单元控制电子
切换开关的一端与所述cpld连接;或当所述故障检测单元确定所述bmc正常时,所述处理单元控制电子切换开关的一端与所述bmc连接。
49上述装置实施例中,与上述电路实施例中相同或相近之处,不再赘述。
50本说明书还公开了一种电子设备,所述电子设备包括存储器和处理器。所述存储器和所述处理器通过总线相互之间通信,所述存储器存储可被所述处理器执行的程序指令,所述处理器调用所述程序指令,执行如上所述的方法。
51本说明书还公开了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被计算机处理器执行时实现如上所述的方法。
52本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
53专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
54以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

如果在超威服务器 BMC(Baseboard Management Controller)更新过程中遇到断电等异常情况,可能会导致 BMC 固件损坏或无法正常工作。在这种情况下,建议按照以下步骤进行处理:
尝试重新启动服务器:首先,将服务器断电,等待数秒钟后再重新通电,然后尝试启动服务器,看是否能够正常工作。如果服务器能够正常启动,可以尝试重新进行 BMC 固件更新。
使用 BMC 恢复工具进行修复:如果服务器无法正常启动或者 BMC 仍然无法正常工作,可以尝试使用超威提供的 BMC 恢复工具进行修复。具体 *** 作方法和工具下载链接可以在超威官方网站上找到。
联系超威技术支持:如果以上方法都无法解决问题,建议联系超威技术支持寻求进一步的帮助和支持。
需要注意的是,在进行 BMC 更新等重要 *** 作时,建议提前备份数据和设置,以便在出现异常情况时能够快速恢复系统。同时,也建议在更新 BMC 前仔细阅读相关文档,并确保 *** 作正确、稳定。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/12763763.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-27
下一篇 2023-05-27

发表评论

登录后才能评论

评论列表(0条)

保存