如何排除服务器中RAID5的故障
随着技术的不断进步,不同类型的服务器处理RAID5故障的方式也不同。
目前大型应用的网络拓扑结构一般采用C/S结构或B/S结构,至少需要在中心机房放置一台拥有大型数据库的服务器。考虑到服务器的安全性和可靠性,通常采用冗余磁盘冗余阵列(RAID)来备份服务器的磁盘。其中,RAID5阵列级是无独立校验磁盘的奇偶校验磁盘阵列,采用数据分区和独立访问技术,可以并行处理同一磁盘上的多个访问请求,同时允许阵列中任意一个硬盘出现故障。
实际中,一些不可避免的客观原因可能会导致一些阵列故障。最常见的情况是硬盘自行脱机,联机状态显示为DDD(无效磁盘驱动器),硬盘出现物理或逻辑故障。如果是物理故障,只需更换硬盘;如果是逻辑故障,可以通过有针对性的技术进行修复,恢复硬盘的在线状态,将硬盘数据的条带化分布状态保留在其原阵列中,延续数据存储系统的一致性。
但是,一些旧的惠普服务器(如HPLH6000)的数据恢复与新服务器(如HPProLian服务器)的数据恢复是不同的。因此,不同的服务器处理RAID5故障的方式不同。我接触过两台服务器意外断电导致RAID5阵列卡数据失效的情况,采用不同的策略解决了问题。
故障排除
一个是惠普LH6000服务器,4块18GB硬盘做成RAID5磁盘阵列,其阵列卡是NetRaid另一款是惠普ProLianML370服务器,采用4块146GB硬盘作为RAID5磁盘阵列,其阵列卡为SmartArray642,带热备硬盘。两个 *** 作系统都是Window2000,数据库是Server2000。
惠普LH6000的故障是这样的:一个硬盘的红灯在闪,机器还在正常运行,但是没多久系统就正常运行了,然后发现另一个硬盘的红灯也在闪。
解决方案如下:
1.启动服务器,在对阵列进行自检时按Ctrl+M进入NetRaid管理程序。查看阵列信息,发现硬盘状态为故障,通过修改配置强行将一块硬盘设置为在线。重启服务器,但进入系统前硬件自检无效,启动失败。
2.启动服务器,在阵列自检时按Ctrl+M进入NetRaid管理程序。选择磁盘阵列,手动使原来在线挂起的硬盘失效,然后手动将另一个失效的硬盘设置为在线,重启服务器进入系统。
3.检查系统和数据库运行正常,然后进入阵列配置工具,手动设置故障硬盘进行重建。100%重建后,重新启动服务器,所有阵列和系统都将恢复到原始状态。
另一台运行ERP系统的服务器(HPProLiantML370)由4块146GB热插拔硬盘通过RAID卡(智能阵列卡)配置成RAID5级磁盘阵列。其中一个硬盘在运行过程中突然出现故障。服务器RAID5自动启用热备盘来逻辑替换损坏的硬盘。整个硬盘的数据访问任务仍然完全按照读写过程的原顺序运行,应用程序和数据库没有影响。
通过惠普提供的ACU工具检查硬盘状态,发现有红灯警告的硬盘离线。如果HPProLiant服务器中Raid5的两个硬盘显示红灯,说明系统已经崩溃,无法访问数据库,但系统不会自动关机。当第二块硬盘亮起红灯时,数据无法通过常规手段恢复。你得付钱给专业的第三方数据恢复公司来恢复数据。
因此,对于旧的HPLH6000系列服务器,阵列的设计与当前的HPProLiant系列服务器有许多不同之处。就 *** 作方法而言,HPLH6000服务器的阵列 *** 作方法有多种选择,包括删除阵列,阵列出现故障后重新构建。初始化也是手动选择的。但是,HPProLiant系列服务器阵列的初始化是在阵列配置后在后台自动执行的,因此ProLiant系列服务器无法在出现阵列错误后重新配置阵列。
HPLH6000服务器会因为其他意想不到的原因导致阵列中的磁盘掉落,所以维护人员可以手动选择使用联机或脱机、重建等。来恢复数据。但是现在的HPProLiant系列服务器不会像老的服务器一样在阵列中出现掉盘的情况,所以当硬盘亮起时,这块硬盘基本已经损坏,需要更换。当然可以选择热插拔硬盘重建,看看硬盘还能不能用一段时间。
做技术备份
从上面两个例子可以看出,同一品牌不同系列的服务器的Raid5磁盘的故障排除,因为嵌入式技术不同,所以故障排除也不一样。但在重建数据后,数据被保存下来,从中可以得出以下教训:
我们认为任何先进的技术都不是万无一失的。如果想保证数据安全,一定要做好备份,最好每天做一次数据库的远程备份。至少备用一个新硬盘。需要指出的是,加入阵列的硬盘必须大于或等于故障硬盘的容量。
如果条件允许,推荐RAID5+热备盘基于的数组创建方案。这样,在数据丢失之前,我们有两次更换硬盘的机会。对于一般应用,只能使用RAID5,可以同时提供数据访问性能、可靠性和最大磁盘空空间。
管理员必须始终观察阵列的状态,包括磁盘阵列的黄色警告灯和管理软件中的驱动器状态。烦恼,及时排除。无论何种级别的阵列,都应在故障排除前进行数据备份。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)