G3服务器,2011年8月生产,安装后一直运行正常,近段常常出现死机现象,需要重启才能正常运行。——想必大伙儿基本能够猜到是什么故障了!
未料,网管这次重启,发现再也不能开机,用U盘引导也不能启动。
我到现场查看。发现启动过程中提示找不到引导文件。某一媒体硬件脱机,建议检查连接线。
再次用U盘引导,查看硬盘,发现三块硬盘均不能读取。
初步考虑,RAID出了问题。
度娘请教,建议到BIOS找到STOREG选项,启动即可。
但搜遍BIOS,没有找到这一选项。
无奈,请教联想客服(装机客服,不是800电话的客服,800打不通),工程师提示,可能RAID卡有故障。印证了笔者的判断。
打开上盖,拆掉RAID卡支架,发现RAID卡电池掉落,搭在下面的主板上。仔细检查RAID卡,没有看到明显异常。
将RAID卡电池恢复原位并固定,装好支架。
上述处理过程中,用吹风机在主板、硬盘架、CPU散热片、电源、内存槽等部位吹出不可思议的大量灰尘。
清理风扇灰尘,装好盖板。
开机,服务器完全恢复正常。
总结经验:1,服务器对工作环境的要求还是有的,不能随便放在什么地方就不管了;
2,服务器必须定期清理灰尘;
3,发现服务器频繁死机,首要的原因就是机内温度过高导致,特别是CPU。
这次服务器故障,就属于灰尘导致的散热不良,继而引起频繁死机。同时,因机内温度过高,导致RAID卡电池不干胶软化,电池脱落,搭在主板上导致短路。RAID卡保护失效所致。
此记,供参考。
以当前主流的M5015、1015、51XX等卡为例,自检后按F1进入uefi,选择对应的选项du进入阵列卡的webbios界面,选择物理视图,选择离线硬 在右边的窗口中单击“驱动器”,单击鼠标左键,在出现的菜单中选择“强制联机”,然后单击“ GO”。
通常,很少会误判阵列卡,如果阵列发生故障,需要更换新的备件。 如果阵列崩溃并且需要还原数据,则不建议这样做。 由于阵列卡的工作机制,最后放置的磁盘通常很难工作。
强制联机通常会失败,并且当无法引导 *** 作系统时,黄灯会亮起,再次脱机。 因此,此方法仅适用于某些情况,例如因误 *** 作导致离线。 如果不正确的磁盘联机,则可能导致数据丢失。
扩展资料:
RAID5当硬盘脱机时,将处理降级状态。 此时,通常是更换硬盘以进行REBUILD还原,以恢复完整的数据状态。 如果有热备用磁盘,将自动执行REBUILD。 *** 作方法如下:
1、启动,然后按Ctrl + H进入阵列卡管理界面Webbios。
2、在以下界面上选择开始按钮。
3、进入webbios界面后,您可以查看所有硬盘的状态,并找到三个联机状态和一个未配置的状态。
4、选择未配置的优质硬盘,进入以下界面,然后选择“ Replace Missing PD”,然后单击“ Go”。
5、然后选择“重建驱动器”,然后单击“执行”。 然后重新启动服务器,直到重建完成,所有硬盘驱动器都将变为Online。
raid阵列掉盘与吞吐量大小无关与以下情况有关:
1,连接线是否连接可靠,电源线?数据线?供电是否稳定?
2,硬盘本身是否状态良好?如多次同一块硬盘掉线,请重视此盘。
3,如总是无序掉盘,而你的硬盘又是同一规格同样型号的,请检查或更换raid控制器。
4,raid在进行rebuding(重建或者初始化) *** 作时,请勿大数据量 *** 作。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)