利用高级技术实现可靠性服务器

利用高级技术实现可靠性服务器,第1张

圣诞节就快来临了,在IT人员的愿望清单里,可靠的服务器必不可少。随着虚拟化技术的出现,一台物理服务器承载了几十个工作负载,对可靠性的需求就更加强烈,因为硬件故障与失败的迁移都会导致服务器崩溃,那就麻烦了。
与服务器可靠性相关的技术,如冗余电源供应、内存错误监测与纠正都进行得有点慢。需要识别、容纳与解决故障条件的协议与行为花费太昂贵,而且横跨所有层的交互 *** 作并没有广泛的实施标准。本文介绍一些最新的工具,方便IT人士打造可靠的服务器。
存储子系统可靠性
检查奇偶校验位与错误纠正码ECC的技术可追溯到十多年前,较新的内存热备份与镜像都也比较完善。当然,随着内存数量与其重要性在服务器中伴随着虚拟化蹭蹭上升,我们需要更强悍的内存控制技术。
请求与巡视清除是ECC内存的高级应用。在请求清除中,系统可在运行期间纠正随机或偶然的ECC阅读错误。巡视清除可积极主动地定位并纠结系统内存中的错误。如果这些行动对于修复内存错误还不管用,那么就意味着永久性故障。潜在的永久性故障触发d性功能,如使用镜像内存模式拖拽数据。有些系统会将失败位置打上标签,防止今后使用有问题的内存。
EEC只能在任何内存位置上纠正单位错误,如果是其他高级错误就得用上其他技术。如单台设备数据纠正器SDDC或高级ECC,其结合ECC模式在单个内存芯片里纠正多位内存错误。通过比较,双设备数据纠正器DDDC可让服务器抵御两个内存芯片上同时发生的多位错误。增强型的DDDC或DDDC+1能在此基础上发现并纠正额外的单位错误。这些技术解决了范围更广的内存小故障,预防共工作负载崩溃。
内存镜像通过提供DIMM保护内存,对内存内容进行同步化的复制。当监测到有内存故障,系统交换到镜像副本,直到替换出故障的DIMM市面上的新款服务器支持局部内存镜像:只对任务关键工作负载所用服务器部分内存进行镜像。显然,这是降低成本的一种方式。
处理器子系统可靠性
服务器可靠性最大的威胁是在于当内存或处理器故障传达到系统,并且在工作负载之间传递。数据遏制模式识别一个或多个内存位置有错误,预防其他进程继续使用。例如在发生不可纠正错误时,过滤模式阻止系统将网络数据移动到PCIe总线,隔离服务器,阻止任何意外的网络数据传输到用户或其他服务器那去。
服务器使用处理器清除,将工作负载从有错的处理器核心无缝迁移到空闲的核心。有错的处理器就一直空闲着,直到解决了错误问题。至于内存清除,处理器清除只能在你的服务器有空余核心时才能发挥效用,所以对于利用率高的主机来说不太方便,因为无法忍受宕机时间。如果你的服务器使用插座禁用功能,它甚至可以启动一个有故障的处理器。
可靠性服务器的其他功能
过去,服务器故障会导致关闭整个系统,修复有错的设备。某些服务器现在包括热添加或热插拔功能,所有在服务器运行期间,有相关技术能升级或替换核心组件,如CPU、DIMM、PCIe卡等。
热添加是电气工程的、BIOS和 *** 作系统智能的结晶。某些 *** 作系统,如Windows
Server
2008
R2、Red
Hat
Enterprise
Linux
6与SUSE
Linux
Enterprise
Server
11,可在服务器运行期间识别新资源并加以配置。

服务器与计算机的区别:
一、高扩展性
可扩展性是指服务器的配置(内存、硬盘、处理器等)可以在原有基础上很方便地根据需要增加。
为了实现扩展性,服务器的机箱一般都比普通的机箱大一倍以上。设计大机箱的原因有两个:一是机箱内部通风良好;二是机箱设有七八个硬盘托架,可以放置更多硬盘。
服务器的电源输出功率比普通PC大得多,甚至有冗余电源(即两个电源)。机箱电源的D型电源接口有十几个之多,普通PC的机箱只有五六个。
服务器的内存在可以根据需要扩展,一般可以扩展到几GB
二、高可靠性
因为服务器在网络中是连续不断地工作的,因此,服务器的可靠性要求是非常高的,目前,提高可靠性的普通做法是部件的冗条配置。服务器可采用ECC 内存、RAID技术、热插拨技术、冗余电源、冗余风扇等做法使服务器具备(支持热插拨功能)容错能力和安全保护能力,从而提高可靠性
硬件的冗余设备支持热插拨功能,如冗余电源风扇等,可以在单个部件夹效的情况下自动切换到备用的设备上,保证系统运行的连续性。RAID技术可保证硬盘在出现问题时在线切换,从而保证了数据的完整性。
三、高处理能力
服务器可能需要同响应数十、数百、数千台客户机的请求,因此,服务器的速度应该比普通的PC快。
决定CPU性能的因素有很多,CPU只是其中一个因素,其它,如硬盘的速度、内存的大小、网卡的数据吞吐能力等,都是制约服务器性能的重要因素。
四、高I/O性能
SCSI技术、RAID技术、高速智能网卡、较大的内存扩充能力都是提高IA架构服务器的I/O能力的有效途径。
五、高无故障运行时间
一般来说,工作服务器的要求是工作时间内(每天8小时,每周5天)没有故障;部门级服务器的要求是每天24小时,每周5天内没有故障;企业服务器要求全年365天,每天24小时都没有故障,服务器随时可用,简称为7x24。
六、高强管理性
IA架构服务器主板上集成了各种传感器,用于检测服务器上的各种硬件设备。配合相应软件,可以远程监测服务器。
七、运行服务器 *** 作系统
服务器是硬件与软件相结合的系统虽然在一台普通PC上安装网络 *** 作系统,也可以称之为服务器,但这台服务器不具备真正服务器的特性。
八、提供网络服务
已经具备了相应硬件平台和 *** 作系统的服务器还不能发挥它的作用。如果要发挥它的作用,必须在网络服务器上安装网络服务软件。

参考资料:

江西省计算机培训学院《Windows 2003网络管理专业教程》

北斗卫星时钟服务器组合选用高精度GPS 接收机/北斗二代接收机/外部B码基准/NTP输入,提供高可靠性、高冗余度的时间基准信号,并采用先进的时间频率测控技术驯服晶振,使守时电路输出的时间同步信号精密同步在GPS/北斗/外部B码/NTP输入时间基准上,输出短期和长期稳定度都十分优良的高精度同步信号。

   北斗卫星时钟服务器采用精准的测频与智能驯服算法,使振荡器时间频率信号与GPS卫星/北斗卫星/外部B码时间基准保持精密同步。由于装置输出的1PPS等时间信号是内置振荡器的分频秒信号输出,同步于GPS/北斗信号但并不受GPS/北斗秒脉冲信号跳变带来的影响,相当于UTC时间基准的复现。采用了“智能学习算法”的GPS北斗时钟,在驯服晶振过程中能够不断“学习”晶振的运行特性,并将这些参数存入板载存储器中。当外部时间基准出现异常或不可用时,装置能够自动切换到内部守时状态,并依据板载存储器中的参数对晶体振荡器特性进行补偿,使守时电路继续提供高可靠性的时间信息输出,同时避免了因晶体振荡器老化造成的频偏对守时指标的影响。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13231293.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-23
下一篇 2023-06-23

发表评论

登录后才能评论

评论列表(0条)

保存