服务器硬盘亮红灯说明已经坏了,一般是硬件问题,跟软件关系不大。如果是25英寸小硬盘亮红灯的话,又是做的RAID5阵列,就可以拔出硬盘再插上给他重建数据看看,能恢复的几率是50%,只能试试了。
建议赶紧更换硬盘,而且期间不要在有 *** 作,尤其是做了阵列的情况下,最容易让RAID也坏掉,那到时候就真的没救了, 硬盘坏大部分都是因为非法关机造成的,或者是环境因素,比如说共振,温度。
扩展资料:
服务器硬盘特点:
1,速度快:服务器使用的硬盘转速快,可以达到每分钟7200或10000转,甚至更高;它还配置了较大(一般为2MB或4MB)的回写式缓存(已经过时,目前台式机硬盘缓存可达64MB!);平均访问时间比较短。
2,可靠性高:因为服务器硬盘几乎是24小时不停地运转,承受着巨大的工作量。可以说,各硬盘厂商均采用了各自独有的先进技术来保证数据的安全。为了避免意外的损失,服务器硬盘一般都能承受300G到1000G的冲击力。
3,可支持热插拔:热插拔(Hot Swap)是一些服务器支持的硬盘安装方式,可以在服务器不停机的情况下,拔出或插入一块硬盘, *** 作系统自动识别硬盘的改动。这种技术对于24小时不间断运行的服务器来说,是非常必要的。
人为拔插过硬盘,接触不良。如果您是新机器,硬盘亮红灯大多是因为物流等原因,可能某块硬盘没有插到位,接触不良,如果已经使用了一段时间,大多是因为硬盘发生了逻辑上的I/O错误,因为做了Raid以后,需要多块硬盘协同工作,不仅要把文件打碎,还要一起计算校验值,如果在某一块硬盘上计算错误,可能会导致硬盘被踢出阵列,同时亮红灯报警。如果服务器灰尘较多,容易积蓄静电,也会增加硬盘出错的概率。电脑不能开机,你试着按照以下的步骤检查:
1、电源开关故障 ,
当电源开关按键因为老化而导致电源开关按钮按下后不能及时复位,使开关始终处于接通状态,这时就会出现按下电源开关后,主机加电开始启动,但过4秒后自动关机的现象。检查方法为开机后拔掉与主板PW_ON接口相连的面板开关,直接用小螺丝刀短接跳线,观察主机是否还出现4秒关机故障。如果故障消失,就可以断定开关电路存在问题。
2、RESET开关或跳线被短路
尽管此类故障出现的机会不多,但是随着电脑使用时间的增加,RESET键使用的非自锁按钮开关会因为d性失效而出现按下后不能d起,造成始终接通状态;或者因为机箱前面板上的按钮安装不到位或变形,导致RESET开关按钮按下后不能及时复位,长时间处于接通状态;再就是因为我们检修过程中,拉动,拔插时无意中造成RESET线路短接。这时,当我们按下电源开关后,因为主板始终处于复位状态,尽管市电已经接通,CPU风扇和电源风扇,显卡风扇,主板风扇都开始工作,但主机没有任何启动迹像。如果我们有DEBUG卡插入PCI插槽时,我们就会立即发现复位灯始终显亮,就可以马上判断RESET相关电源存在短接现象。
3、内存有故障
内存某芯片或阻容出现故障时,有时会出现开机后主机能够加电,但没有正常启动的“嘀”声,也无内存报警声,长时间不能启动。 再一种情况就是如果CMOS设置时内存的频率或相关参数设置错误时,也会出现加电主机能够加电,但就是不启动也无报警声的现象。
故障排除:对于此类故障我们可以先拔下内存再开机,如果主机内存报警,说明CPU和主机基本正常。再试着清除CMOS设置后看故障能否解决,如果故障排除说明故障原因是由于CMOS中内存参数设置错误造成的;如果还不行,我们就需要使用替换法,一般都可以排除内存故障。按照常理说,硬盘故障了,会自动亮红灯,故障消除后会自动恢复正常,这个本来是服务器自带的功能。但现实情况往往不是这样,即使硬盘故障了,现场通过外观也看不出来。
在运维的工作中,很大也是很重要的一项工作就是故障处理,而故障处理中以硬盘故障最为常见。如果更换错误,可能会造成数据丢失,后果很严重。那么如何能够准确快速的更换硬盘呢?给故障的硬盘点灯是一个非常好的选择。
无论是raid卡还是HBA卡,每块硬盘都有对应的LED灯,这些LED灯常用来指示磁盘的状态和行为。例如正常状态显示绿色,故障状态显示红色,rebuild状态显示粉色等等。
通过控制这些硬盘灯颜色的变化,现场 *** 作时一眼就能定位到是哪块盘故障了,非常的直观(当然色盲可能有点难度,不过控制闪烁也能区分出来)。
除了定位故障硬盘更加直观以后,也减少了我们误 *** 作的概率。因为这个点灯 *** 作是在 *** 作系统里触发的,在 *** 作系统里定位的故障硬盘是要更准确的。为什么这么说呢?因为有些厂商服务器标识的硬盘ID号是错误的,尤其是国产的服务器。例如我在系统下看到的id号是[32:1],而服务器物理机上标识得可能是5号盘。
这里我只针对LSI的RAID卡和HBA卡进行讲解。
Raid卡的点灯 *** 作用到如下命令:
MegaCli PdLocate start physdrv[32:1] -a0
使用如下命令可以查看到每块硬盘的具体信息。
不过信息有点多,我们过滤一下信息,得到我们关心的数据。
有了这些信息就可以给硬盘进行点灯了,例如我想给Enclosure Device ID: 252,Slot Number: 1的硬盘点灯。
那么只需要执行如下命令:
关灯使用如下命令:
这里我通过倒叙的方式讲解容易理解一些,也就是结果导向进行思考。
当然,我们先把必要的软件安装上再讲。可以直接通过yum安装两个软件lsscsi、sg3_utils。
获取硬盘灯的状态使用如下命令:
sg_ses --dev-slot-num=1 --get=ident /dev/sg12
一个整体的点灯例子如下:
使用lsscsi -gt获取硬盘信息和enclosu信息,确定故障硬盘的sg信息。这里我这台机器上有12块盘,并且都在都在/dev/sg12上。
根据上面的lsscsi -gt的显示结果,例如我们要给/dev/sdc点灯,那么我们在找到/dev/sdc的dev-slot-num。查找这个信息的命令如下:
sg_ses --sas-addr=0x500e004aaaaaaa02 /dev/sg12
其实sg_ses还有一些其它参数进行显示,可以了解一下。
这3条命令可以把所有硬盘的信息显示出来,从上到下,每条信息的显示结果越来越精简。官方的解释是:
通过这三个参数(clear、get、set)来控制和查看硬盘灯的状态。如何使用就不多解释了,相信大家都能知道。不过要了解一下get到的数字,这里找了一张官方的表格,虽然我也没看懂。
硬盘点灯这个 *** 作其实不难,稍微学习一下就能掌握。关键是如果把这个功能做成自动化的,减少人为干预,减少劳动力,这就需要动动脑子了。
例如可以写成一个脚本,做成定时任务,有故障后自动点灯,故障消除后自动关灯。再关联一下监控报警,再关联一下流程,做到自动报修等等。1、戴尔R720服务器托盘灯不亮,将机器上的所有外设(包括键盘和鼠标)拔除后,看能否正常开机,如能,则在关机的情况下,分别插上键盘、鼠标,并再开机测试。
2、在断电的情况下,将连接硬盘、光驱及软驱的电源线和数据线拔除,开机测试,如果故障消失,则硬盘或光驱或软驱有故障。
3、在断电的情况下,将接插在主板上的内存及所有板卡拔下(可能的有:显示卡、MODEM卡、网卡、声卡、用户自己的板卡),并开机测试,如果故障消失或听到报警音,将内存及那些板卡分别重新插好,并逐次开机测试,如果故障消失,则为接插问题,或板卡问题硬盘红灯是硬盘有问题了,进raid卡webbios的热键看屏幕提示,不一定是ctrl+h,不同的卡这个热键不同,在提示的时候再按,如果还是不行,要看数据是否需要保留再决定怎么做。
按照服务器的结构,可以分为CISC架构的服务器和RISC架构的服务器。CISC架构主要指的是采用英特尔架构技术的服务器,即我们常说的“PC服务器”;RISC架构的服务器指采用非英特尔架构技术的服务器,如采用Power PC、Alpha、PA-RISC、Sparc等RISC CPU的服务器。RISC架构服务器的性能和价格比CISC架构的服务器高得多。
亿万克不会有这样的故障,亿万克是个做服务器很好的公司,买服务器比较推荐亿万克,有兴趣可以去官网了解一下。亿万克集服务器和存储等数据中心产品的研发、生产、销售、服务系统整合于一体,是民族高科技制造企业领导品牌 。
亿万克亚当R922N5+是一款搭载英特尔Purley平台可扩展系列处理器的2U双路计算型服务器,单颗CPU最高拥有28个内核及56线程,最大TDP 205W,结合领先的AI计算性能,能游刃有余地处理企业虚拟化、图形编辑、视频直播、神经网络、深度学习、推理等多种AI 场景应用。感兴趣请点击此处,了解一下。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)