服务器出现故障怎么处理_IT百科

如何排除服务器中RAID5故障

如何排除服务器中RAID5的故障

随着技术的不断进步，不同类型的服务器处理RAID5故障的方式也不同。

目前大型应用的网络拓扑结构一般采用C/S结构或B/S结构，至少需要在中心机房放置一台拥有大型数据库的服务器。考虑到服务器的安全性和可靠性，通常采用冗余磁盘冗余阵列(RAID)来备份服务器的磁盘。其中，RAID5阵列级是无独立校验磁盘的奇偶校验磁盘阵列，采用数据分区和独立访问技术，可以并行处理同一磁盘上的多个访问请求，同时允许阵列中任意一个硬盘出现故障。

实际中，一些不可避免的客观原因可能会导致一些阵列故障。最常见的情况是硬盘自行脱机，联机状态显示为DDD(无效磁盘驱动器)，硬盘出现物理或逻辑故障。如果是物理故障，只需更换硬盘；如果是逻辑故障，可以通过有针对性的技术进行修复，恢复硬盘的在线状态，将硬盘数据的条带化分布状态保留在其原阵列中，延续数据存储系统的一致性。

但是，一些旧的惠普服务器(如HPLH6000)的数据恢复与新服务器(如HPProLian服务器)的数据恢复是不同的。因此，不同的服务器处理RAID5故障的方式不同。我接触过两台服务器意外断电导致RAID5阵列卡数据失效的情况，采用不同的策略解决了问题。

故障排除

一个是惠普LH6000服务器，4块18GB硬盘做成RAID5磁盘阵列，其阵列卡是NetRaid另一款是惠普ProLianML370服务器，采用4块146GB硬盘作为RAID5磁盘阵列，其阵列卡为SmartArray642，带热备硬盘。两个 *** 作系统都是Window2000，数据库是Server2000。

惠普LH6000的故障是这样的:一个硬盘的红灯在闪，机器还在正常运行，但是没多久系统就正常运行了，然后发现另一个硬盘的红灯也在闪。

解决方案如下:

1.启动服务器，在对阵列进行自检时按Ctrl+M进入NetRaid管理程序。查看阵列信息，发现硬盘状态为故障，通过修改配置强行将一块硬盘设置为在线。重启服务器，但进入系统前硬件自检无效，启动失败。

2.启动服务器，在阵列自检时按Ctrl+M进入NetRaid管理程序。选择磁盘阵列，手动使原来在线挂起的硬盘失效，然后手动将另一个失效的硬盘设置为在线，重启服务器进入系统。

3.检查系统和数据库运行正常，然后进入阵列配置工具，手动设置故障硬盘进行重建。100%重建后，重新启动服务器，所有阵列和系统都将恢复到原始状态。

另一台运行ERP系统的服务器(HPProLiantML370)由4块146GB热插拔硬盘通过RAID卡(智能阵列卡)配置成RAID5级磁盘阵列。其中一个硬盘在运行过程中突然出现故障。服务器RAID5自动启用热备盘来逻辑替换损坏的硬盘。整个硬盘的数据访问任务仍然完全按照读写过程的原顺序运行，应用程序和数据库没有影响。

通过惠普提供的ACU工具检查硬盘状态，发现有红灯警告的硬盘离线。如果HPProLiant服务器中Raid5的两个硬盘显示红灯，说明系统已经崩溃，无法访问数据库，但系统不会自动关机。当第二块硬盘亮起红灯时，数据无法通过常规手段恢复。你得付钱给专业的第三方数据恢复公司来恢复数据。

因此，对于旧的HPLH6000系列服务器，阵列的设计与当前的HPProLiant系列服务器有许多不同之处。就 *** 作方法而言，HPLH6000服务器的阵列 *** 作方法有多种选择，包括删除阵列，阵列出现故障后重新构建。初始化也是手动选择的。但是，HPProLiant系列服务器阵列的初始化是在阵列配置后在后台自动执行的，因此ProLiant系列服务器无法在出现阵列错误后重新配置阵列。

HPLH6000服务器会因为其他意想不到的原因导致阵列中的磁盘掉落，所以维护人员可以手动选择使用联机或脱机、重建等。来恢复数据。但是现在的HPProLiant系列服务器不会像老的服务器一样在阵列中出现掉盘的情况，所以当硬盘亮起时，这块硬盘基本已经损坏，需要更换。当然可以选择热插拔硬盘重建，看看硬盘还能不能用一段时间。

做技术备份

从上面两个例子可以看出，同一品牌不同系列的服务器的Raid5磁盘的故障排除，因为嵌入式技术不同，所以故障排除也不一样。但在重建数据后，数据被保存下来，从中可以得出以下教训:

我们认为任何先进的技术都不是万无一失的。如果想保证数据安全，一定要做好备份，最好每天做一次数据库的远程备份。至少备用一个新硬盘。需要指出的是，加入阵列的硬盘必须大于或等于故障硬盘的容量。

如果条件允许，推荐RAID5+热备盘基于的数组创建方案。这样，在数据丢失之前，我们有两次更换硬盘的机会。对于一般应用，只能使用RAID5，可以同时提供数据访问性能、可靠性和最大磁盘空空间。

管理员必须始终观察阵列的状态，包括磁盘阵列的黄色警告灯和管理软件中的驱动器状态。烦恼，及时排除。无论何种级别的阵列，都应在故障排除前进行数据备份。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/bake/833244.html