怎么排除服务器中RAID5故障

怎么排除服务器中RAID5故障,第1张

怎么排除服务器中RAID5故障

但是,对HP的一些老服务器(如HP LH6000)数据的恢复与新服务器(如HP ProLian系列服务器)的数据恢复是不同的。所以不同的服务器对RAID 5故障的处理也是不同的。曾接触过两台服务器因意外断电而造成的RAID 5阵列卡数据故障,由于采用了不同的策略而解决了问题。

故障修复

一台是HP LH6000的服务器,4块18GB的硬盘做成RAID 5磁盘阵列,其阵列卡是NetRaid;另一台是HP ProLian ML370服务器,4块146GB的硬盘做成RAID 5磁盘阵列,其阵列卡是Smart Array 642并带有热备份硬盘(Hot Spare)。两者 *** 作系统都为Window 2000,数据库是Server 2000。

HP LH6000的故障如下: 一块硬盘红灯闪亮,机器还在正常运行,但没有多久,系统就不能正常运行,这时才发现另一块硬盘的红灯也在闪亮。

解决办法如下:

1启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。查看阵列信息,发现硬盘状态为Failed,运用修改配置将一硬盘强行设置成OnLine。重新启动服务器,在进入系统前的硬件自检时无效,启动失败。

2启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。选择磁盘阵列,将原来OnLine挂起来的硬盘手工Fail掉,然后再把另一块Failed的硬盘手工设置成OnLine,重新启动服务器就可以进入系统了。

3查看系统及数据库都运行正常后,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器,所有的阵列及系统都恢复原状了。

另一台运行ERP系统的服务器(HP ProLiant ML370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare),对损坏硬盘进行逻辑替代。整个硬盘的数据访问任务仍然完整地运行在原来的读写进程序列中,应用程序和数据库没有发生影响。

通过HP自带的ACU工具查看硬盘状态进行检查,发现红灯示警的硬盘处于脱机状态。如果HP ProLiant服务器中的Raid 5有两块硬盘出现亮红灯时,表明系统已经崩溃,数据库也就不能访问,但系统不会自动关机。当第二块硬盘亮红灯后,用常规的手段是不能恢复数据的,只有付费找专业的第三方数据恢复公司恢复数据。

因此,对惠普老型号HP LH6000系列服务器来说,阵列的设计方面与现在HP ProLiant系列服务器的阵列有很多不同。就 *** 作方法看,HP LH6000服务器的阵列 *** 作方法有很多可选项,包括阵列失败后可以重新删除阵列并重建等,初始化也是手工选择的。但是HP ProLiant系列服务器阵列的初始化是在配置阵列后自动在后台执行的,所以ProLiant系列服务器在阵列出错后是不能重配阵列的。

HP LH6000服务器会因其他意外的原因导致阵列中的磁盘出现掉线现象,可让维护人员手工选择用Online或Offline、Rebuild等来恢复数据。但是现在的HP ProLiant系列服务器在阵列中不会再出现像老的服务器那样有磁盘掉线的现象,所以硬盘亮红灯的时候,这块硬盘基本上是损坏了需要更换。当然可以选择热插拔硬盘来重建(Rebuild),看硬盘还能不能再用一段时间。

做好技术后备

从以上两个例子可以看出,同一品牌、不同系列的服务器因其内含技术的不同,其Raid 5磁盘故障的排除也是不同的。但经过重建(Rebuild)数据后,数据被拯救了,从中可以得出以下经验:

我们认为任何先进的技术手段都不是万无一失的。如果要确保数据安全,就一定要做好备份工作,最好每天做一次数据库的异地备份。至少备用一块新硬盘。需要指出的是,加入阵列的硬盘必须大于或等于故障硬盘的容量。

如果条件允许,推荐“RAID 5+热备盘”的阵列创建方案。这样在数据丢失前,我们有两次更换硬盘的机会。对于一般的应用,只用RAID 5即可,可以同时提供数据的存取性能、可靠性和最大的磁盘空间。

管理员必须经常观察阵列的状态,包括查看磁盘阵列的警告灯和管理软件里的驱动器状态。出现故障,及时排除。无论是什么级别的阵列,在排除故障前,都应做好数据备份。

;

双机热备软件对硬件要求不高,2台服务器必须双网卡,目前所有的双机软件都支持windows 2008 *** 作系统。支持主流的SQL,Oracle数据库。
目前市场上有rose ha,lifekeeper,nec expresscluster,emc autostart,双机热备软件,rose属于低端产品价位在6000左右,lifekeeper属于中端,1万~2万之间,emc autostart和nec expresscluster属于高端些的,价格要2万多。你可以根据情况选择产品

你的问题理论上是不应该出现的!P400的8个口虽然分为 Slot1、Slot2,本质上是没有区别的,可以混用。
你碰的问题应该是 *** 作、安装问题。
但是在 RAID5 出现盘损坏需要更换时 盘位是很重要的,一旦RAID5已经构建,千万不要更换组RAID磁盘位置。如果某个盘位出现 橙色或红色 可直接更换新盘,无需任何 *** 作,P400会在新盘上自动修复。

1,双机热备特指基于高可用系统中的两台服务器的热备(或高可用),因两机高可用在国内使用较多,故得名双机热备。

2,以一般常用的SQL服务的双机热备为例:先在两台服务器上安装服务器系统。

3,然后建立一个或多个磁盘阵列,将两台服务器上的SQL数据保存在磁盘阵列上。

4,然后安装一款集群软件,如:微软MSCS,Symantec VCS,ATANG Cluster等。

5,然后在软件上分别设置主和副服务器。以MSCS为例,先在服务器上安装Advanced Server或DataCenter Server。 然后在两台服务器添加相同的管理员帐号和密码。即帐号在每个节点上,都必须具有管理员权限。所有节点都必须是成员服务器,或者所有的节点是同一个域里的域控制器。在群集中,不允许一部分是域成员,一部分是域控制器。

6,然后安装集群管理软件,开启磁盘阵列,在两台电脑上设置共享磁盘,并验证共享磁盘国。

7,然后关闭第一个服务器,配置第二个节点,配置完成后,关闭第二个服务器,打开第一个服务器,配置第一个节点。

8,最后,开启两个服务器和磁盘阵列。

双机热备特指基于高可用系统中的两台服务器的热备(或高可用),因两机高可用在国内使用较多,故得名双机热备,双机高可用按工作中的切换方式分为:主-备方式(Active-Standby方式)和双主机方式(Active-Active方式),主-备方式即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)。

没法给你太大帮助,因为我只搞过惠普,不过原理伤应该时相通得,说下惠普上怎么搞吧。
更换坏的硬盘和 *** 作系统无关的,服务器应该配有专门的配置光盘可以加载启动,里面就有raid配置工具。要不关机 *** 作就要看系统里安装有raid管理工具没有。服务器数据是无价的东西,如果你有服务器基础建议看下该服务器的资料再咨询官方售后支持进行 *** 作。如果基础不好还是请专业的来吧。以免悲剧

损失两块磁盘。
每个raid5 卷 都必须有他自己的校验盘。
你可以看看我在别处的这个回答。关于raid50的回答。加深你对raid的认识。
>

这个网上很多网页链接

开机自检检测到HP Smart Array P410

(如果没有看到这个信息,

自检的时候会提示按任意键(当看到press any key to view rom rom messages),

多次按空格键,就可以显示该信息)

按F8进入阵列配置界面,选择Create Lgical Drive,回车继续。

如果你是把固态硬盘 组raid 进行装系统,最好用引导盘。或者你U盘里下载好raid驱动,安装过程提示安装raid驱动时 手工进行加载。

你的问题可以归纳为HP服务器动态调整RAID。
最稳妥的办法是把新加的几块一盘构建成一个新的RAID 5阵列,不建议加入到原有阵列中。硬盘的容量、转速参数稍有差别,很容易导致RAID崩溃。
如果一定要把新老硬盘做到一个RAID里面,请先做数据备份,然后在NETRAID工具中把老阵列中的一块硬盘设置成Faile,同时可以设置一块新加的硬盘online,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器。
同一品牌、不同系列的服务器因其内含技术的不同,其Raid 5磁盘阵列的设置方式也是不同的。但经过重建(Rebuild)数据后,数据可以保存下来。
任何先进的技术手段都不是万无一失的。如果要确保数据安全,就一定要做好备份工作,最好每天做一次数据库的异地备份。至少备用一块新硬盘。需要指出的是,加入阵列的硬盘必须大于或等于故障硬盘的容量。
如果条件允许,推荐“RAID 5+热备盘”的阵列创建方案。这样在数据丢失前,我们有两次更换硬盘的机会。对于一般的应用,只用RAID 5即可,可以同时提供数据的存取性能、可靠性和最大的磁盘
空间。
管理员必须经常观察阵列的状态,包括查看磁盘阵列的**警告灯和管理软件里的驱动器状态。出现故障,及时排除。无论是什么级别的阵列,在排除故障前,都应做好数据备份。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13258129.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-27
下一篇 2023-06-27

发表评论

登录后才能评论

评论列表(0条)

保存