一、冗余的电源供应
站长需要确保选用的香港机房拥有冗余的电源供应,包括企业级不间断电源、定期检测的备用发电机等。尽管停电可能只会偶尔发生,但是选择到香港机房如果不具备没有冗余电力,这可能导致租用的香港服务器因短时间电力难以恢复的问题而导致网站业务持续中断。因此选择香港机房很重要,精心设计的电力系统会解决本地电源故障、电压变化以及短期和长期停电问题。
二、服务器硬件冗余
硬件非常重要。香港服务器中的硬件设备和网络硬件都应该是以冗余的方式构建。如果您选择的服务商和数据中心足够负责,这些设施都应具备。其中,香港服务器租用,通常都接入多条国际线路,以BGP智能切换最佳路由,保障网络冗余,顺便一提,葵芳的香港服务器租用,已接入中国电信CN2专线直达香港,大陆访问更快更稳定。关于服务器硬件的冗余,一般需要客户付费部署RAID磁盘阵列,可提供更高的数据可靠性。
三、保持软件最新版本和补丁更新
香港服务器中软件需要保持更新,尤其是与安全相关的软件。毕竟,大量的服务中断是由应用程序故障引起的,例如d性负载平衡软件故障等。而且,未及时更新版本和安全补丁,容易被黑客入侵进而导致更严重的损害。
四、服务器硬件故障监控
针对硬件设施提供密切的监控是不可缺少的。站长应当随时保持对服务器硬件和软件的密切关注,并确保有一个系统可以在突发故障时即时提醒您。当然,可靠的香港服务器租用服务商一定会部署这样的实时监控系统。因此站长在选择香港服务器租用时应当确认服务商是否具备这样的部署。
五、降低人为 *** 作的失误率
在引发在线业务停滞的事件中,大多数情况不是由服务器或者数据中心引起的,而是应用程序故障、系统缺陷以及人为错误 *** 作导致的。因此,站长就需要尽可能提升服务器管理水平或者请专业人士来管理服务器。同样的芯片、加上标准化的架构、协议和接口在赋予x86服务器良好的通用性的同时,也为其带来了副作用——同质化,而大量同质化的产品不可避免地会走向厂家们所厌恶的“价格战”,因此,避免同质化,寻求差异化一直是各大x86服务器厂商所追求的目标之一。例如,在华为服务器部门近日所举办的一个交流会上,华为服务器总经理邱隆就明确表示,华为服务器设计与生产原则就是通过创新提供高质量、高可靠、差异化的产品。
用创新提供差异化产品,这个理念当然正确无疑,不只是华为,别的x86服务器厂商也视之为正途。所以,记者以为,这里面至少有两个问题:第一,x86服务器的创新空间究竟有多大因为如果留给厂家的创新空间并不大的话,那也谈不上多大的差异化;第二,华为在服务器上究竟进行了多少实打实的创新
对于第一个问题,邱隆的回答是:“如果没有云计算 [注] 和大数据 [注] ,x86服务器创新的空间的确不大,但是有了云计算和大数据,我们认为x86服务器创新的空间很大,再过几年,你可能会发现那时的服务器和现在相比会有很大的不同。”
对于第二个问题。邱隆表示,华为进行创新不是聚焦一个或几个点,而是从上到下,贯穿服务器的各个层面。从芯片、工程、架构和应用方案这四个层面对服务器进行创新。例如,在芯片层面,除了计算芯片外,其他芯片华为都追求自主研发,目前已经有了管理芯片AISC、SSD控制器、RAID控制器;在工程领域,华为服务器陆续实现了耐55度高温设计、PCie热插拔、正交背板、内存板热插拔、全面支持25G网络,等等;在架构创新方面,华为配合英特尔率先推出ATCA架构服务器,并利用ATCA架构服务器帮助电信用户替换掉了小型机,接着华为顺利实现超融合架构服务器商用、并推出32路x86容错服务器;在应用与方案创新上面,目前全世界最大的两个SAP HANA系统(一个部署在中石油、一个部署在中石化)就是华为建设的。
根据华为提供的服务器创新路线图,从2015年到2018年,华为FusionServer服务器创新主要聚焦于融合IO芯片、新型SSD控制器、CPU热插拔、光互连、相共振天线、RAS20架构、基于故障数据库的PFA、全解偶的DC 30、重删/压缩特性的VDI一体机、SPARK一体机等方面。
除了用创新塑造差异性,产品的高质量也是华为服务器狠抓的重点。邱隆表示,遑论欧美,即使在中国,人力成本也越来越高,如果产品质量不好,维护的成本会远远高于产品的售价。目前(+本站微信networkworldweixin),根据华为提供的数据,华为FusionServer服务器平均故障率低于15%,该公司新近获得阿里质量大奖和腾讯最佳供应商奖。前段时间在日本举办的2015东京Interop展上,华为FusionServer RH8100 V3关键业务服务器赢得了Interop大奖。
此外,华为并不像其他国产品牌x86服务器厂商那么在意国内x86服务器市场头把交椅的位置。相比之下,华为更看重海外市场。
“华为本身就是个全球化的公司,而且中国服务器市场毕竟只占全球服务器市场的7%到8%,如果我们把海外市场做大了,那么整体销量也就上去了。”邱隆解释说。
Gartner 2015年第一季度服务器追踪报告显示,华为FusionServer服务器海外增长十分迅猛,即使是北美市场,其出货量也达到了87%的同比增长。目前,华为FusionServer服务器海外销售占其整体销量的24%,该公司希望明年能将这一比例提高到50%。容错软件的定义:
1。对自身的错误的作用具有屏蔽作用
2。可以从错误状态恢复到正常状态
3。发生错误时,能完成预期的功能
4。在一定程度上具有容错能力
实现容错技术主要是冗余:
1。结构冗余
2。信息冗余
3。时间冗余
4。冗余附加技术
世纪80年代,第一代容错技术就开始进入商用领域。美国Stratus(容错公司)在Stratus独特的硬件级容错技术及VOS专有 *** 作系统环境下,采用了Motorola M68000处理器。
1993年,Intel I860处理器在Stratus的硬件级容错体系结构中成功应用,在软件环境方面,还能满足业界对开放性要求的Unix *** 作系统FTX,即AT&T UNIX SVR4。
1996年,容错技术得到HP的支持,共同推出Stratus Continuum系列,将Stratus容错结构结合HP PA-RISC对称多处理技术。
进入21世纪以来,制造、中小企业、能源、交通等领域对服务器,特别是中低端IA服务器的需求激增,过去仅仅可以应用在RISC平台、HP-UX环境下的容错产品也面临着新的挑战。另一方面,企业越来越依赖信息系统来完成关键业务的应用,同时他们不可能配备更多的专业人员来进行专职维护。双机热备、集群服务器遇到难题。
如今:NEC通过与美国容错公司多年的合作,于2001年推出了业界第一台基于IA架构、支持Microsoft Win-dows Server 2000标准 *** 作系统环境的容错服务器。NEC的Express5800/ft系列在Windows及Linux平台上的可靠性达到了99999%,这种实时保护技术来源于STRATUS连续处理技术(Fundamentals of Continuous Pro-cessing Design),它包括:
1、LOCKSTEP 技术
LOCKSTEP技术使用相同的、冗余的硬件组件在同一时间内处理相同的指令。LOCKSTEP技术可以保持多个CPU、内存精确的同步,在正确的相同时钟周期内执行相同的指令。该技术保证能够发现任何错误,即使短暂的错误,系统也能在不间断处理和不损失数据的情况下恢复正常运行。
2、安全故障(FAILSAFE)软件
FAILSAFE 软件和LOCKSTEP技术运行一样,可防止很多软件错误和储运耗损。该软件在Windows 2000/2003环境下采用热插拔、内存镜像、负载均衡、多点终止失效、多通道I/O等方式,大大增强了系统连续运行的稳定性。
FAILSAFE可以管理和诊断特征捕获,分析和通报服务器的软件问题,从而允许个人在软件发生错误之前去纠正错误。FAILSAFE软件的下列功能增强了NEC Express5800/ft系统在Windows环境中的可靠性:保护短暂的硬件故障;通过增强的驱动程序预防软件失效;软件问题的捕获、分析及修正;内存数据的连续性维持;丰富的纠错功能可以解决各种不同的错误。为了避免物理撞击等意外故障,安全故障软件还提供了自动重启功能,能够将宕机前CPU与内存数据即时保存下来,最大限度地避免数据的意外丢失。
3、激活服务(ACTIVE SERVICE )
当然,假如容错服务器的硬件发生永久性故障,尽管系统能够正常运行,也必须及时更换硬件才能维持容错的冗余架构。容错服务器都配备了简易直观的图形界面来管理监测工具,(如NECExpress5800/ft提供了ESMPRO 管理软件),能够对服务器中硬件运行及故障状态进行适时监控。
未来
容错技术的应用已经开始从过去的证券、电信等领域进入基础行业,如制造、能源、物流、交通及有着"7×24"不间断运营需求的中小商业团体和政府。NEC为迎合互联网的高速增长,为容错服务器引入了最新的稳定、安全、可升级、功能强大的Linux版本。
容错的未来将会向更高的可用性、更卓越的可维护性发展。调查显示,越来越多的用户开始注重TCO(总拥有成本)而不是初期购买价格,更多的企业决定逐步放弃采用双机热备的方式来维护复杂的集群服务器,转而将目光瞄向具有容错技术的平台或容错服务器平台。
在中国市场,NEC 公司与神州数码的合作在一定程度上弥补了容错服务器在中国市场服务拓展领域的短板。这将引发国内各领域的容错技术与应用的井喷式发展。
主流应用的服务器容错技术有三类,它们分别是:服务器群集技术、双机热备份技术和单机容错技术。它们各自所对应的容错级别是从低到高的,也就是说服务器群集技术容错级别最低,而单机容错技术级别最高。由此可知它们各自应用的行业容错级别需求也是从低到高的。本文主要介绍后两种容错技术,先来看一下双机热备份容错技术。双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份软件组成。
在这个容错方案中, *** 作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。
双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。
双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。
双机热备模式即通常所说的active/standby方式,active服务器处于工作状态;而standby服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器,这是采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。从上面的分析我们知道,双机热备份技术所采用的是两台配置完全一样的服务器系统,其实服务器群集方案中的容错技术也是一种多服务器容错技术。而本节所要介绍的单机容错技术则是在一台服务器实现高性能容错的,它的容错能力要远比服务器群集和双机热备份中容错能力要高,所以更加适合那些如证券、电信、金融、医疗等对容错能力特别苛刻的行业。
以往的集群系统在出现故障的情况下,需要中断服务器的运行,然后用一定的时间切换至备用的服务器上面进行运行,才能进行维修和恢复,这其中所付出的成本和带来的损失是用户最不愿意看到的。具有容错技术的容错服务器,最大的优势就在于它能够自动分离故障模块,在不中断运行的情况下,进行模块调换,对损坏的部件进行维护,并且在一切物理故障消除后,系统会自动重新同步运行,从而有效的解决了客户的后顾之忧。正因如此,具有容错技术的容错服务器,正在冲击前几年兴起的双机热备份和集群技术,越来越被人们所关注。同时,更为难得的是它可以在采用符合工业标准部件的服务器中实现(IA架构服务器),极具竞争力的成本优势,更使得容错服务器令人刮目相看。
容错服务器是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份;通过系统内所有冗余部件的同步运行,实现真正意义上的容错。系统任何部件的故障都不会造成系统停顿和数据丢失。很多容错系统是基于IA架构的服务器,与Windows2000完全兼容,实现以前只有在RISC系统上才能实现的容错。这种容错技术在IA服务器上的实现,将IA服务器的可靠性提高到了99999%,同时服务器的运行是不间断的。
双机热备份和容错服务器的定位稍微有些不同,这是由两者实现的可用性差别决定的。双机热备份一般可以实现999%的可用性,容错服务器却可以实现99999%的可用性。这样,双机热备份大多应用在业务连续性不是很严格的行业,比如说公安系统、部队系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如电信、金融、证券和医疗等要求高的行业则是容错服务器的天下。还要注意的一点是双机热备份与服务器群集并不一样,双机热备份通常要求两对路服务器的配置完全一样,而服务器群集则没有这方面的严格要求,这也是许多读者容易混淆的。
另外,双机热备份方式由于需要至少2台服务器,导致在软件采购( *** 作系统、中间件、双机备份软件等)、软件维护升级、系统硬件升级都需要比单机容错方式多1倍的额外投入,而且在双机备份软件出现故障后,其维修的难度较高,对客户会带来较大困难。因此虽然单机容错服务器的硬件成本高于双机备份方式的硬件投入,而其总成本(TCO)却远远低于双机备份方式的成本。但是就其灵活配置方面,双机热备份方案更具优势,许多热备份方案都是由一些系统集成商组合不同厂家服务器产品进行的,可以满足不同客户需求。但总体来说,容错服务器是未来发展的趋势。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)