联想服务器 raid 的问题

联想服务器 raid 的问题,第1张

1,硬盘灯都不亮,肯定是供电有问题。检查一下背板供电。
2,硬盘没运行,阵列卡也识别不到硬盘。RAID肯定也检测不到。
3,绝对不能重新做RAID。重新做数据就丢了。
4,有的型号的阵列卡换了同类型的阵列卡后RAID还可以正常使用,但是有的不行。所以你最好看看你的到底行不行。
我建议你:
1,硬盘灯不亮问题应该好定位,先把硬盘运行起来可能问题就解决了
2,1失败的情况下再换同型号的服务器试试,千万别重新做RAID。

有以下几种方式排故障:
1三台服务器同时slot2热备盘检测failed,首先考虑是否阵列卡驱动版本及阵列卡固件版本导致,登陆华为网站确认三台机器版本为最新,登陆lsi网站也未找到更新固件,因此考虑重新做热备盘,重做后反复重启服务器,故障又开始复现。
2开始分析Raid卡日志,利用FusionServerTools-InfoCollect收集日志,通过日志分析发现热备盘Unalbetoaccess后状态由UNCONFIGURED_GOOD变为UNCONFIGUREDBAD。
3找到报错提示后继续分析日志发现30分钟后热备电源状态变为POWERSAVE。
4通过日志分析判断故障应该在热备盘节能导致,关闭热备盘节能后故障排除。

您好
第一类:
RAID卡本身有问题
经常表现为RAID信息丢失,硬盘经常掉线,不能做REBUILD,开机自检时检测不到硬盘或时间长。
典型故障A:
作完RAID1,安装 *** 作系统,一切正常,但第二次重启系统时,发出报警声,经检查发现一块硬盘掉线,REBUILD后,又恢复正常,但重启后又掉线。怀疑为硬盘故障,校验硬盘后均无问题。最后更换RAID卡,故障解决。
典型故障B:
机器经常死机,且有时候启动速度非常慢。观察系统日志,发现在系统启动时有这样一个错误提示:设备/devices/scsi/port0
在传输等待的时间内没有响应。更换RAID卡后,恢复正常。
第二类:
硬盘本身问题
表现为硬盘掉线,在RAID阵列中的状态为DEAD,或者在作REBUILD时,作到某一进度就不能继续
典型故障:
硬盘掉线后,做REBUILD时,作到20%时出现错误提示无法继续进行。在确认掉线硬盘,硬盘盒及SCSI电缆都能正常工作后,对在线硬盘进行校验,发现有坏道,修复硬盘,重做REBUILD,恢复正常。

你确认是raid5,如果是,你找到故障的硬盘,可能指示灯是红色的,拉住硬盘把手,把它拔出来,然后将新的同型号的硬盘再塞进去,扣上把手即可,然后服务器就开始自动自己校验写盘,这个不用你管!等几个小时就好了,灯不再狂闪就标明已经恢复数据成功了!


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10275519.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-07
下一篇 2023-05-07

发表评论

登录后才能评论

评论列表(0条)

保存