服务器监控硬盘状态

服务器监控硬盘状态,第1张

对服务器来说,硬盘因为其机械结构,是最容易出现故障的设备。但恰恰是这最容易出现故障的设备中,存储着对企业来说最至关重要的IT资源——数据。一旦硬盘出现故障,会给企业带来重大的损失。据统计,为了解决硬盘故障带来的损失,目前全球每年的数据恢复市场价值大约在千亿美元——而这仅仅是是企业损失的一小部分。近年来,为了解决这一问题衍生出了大量的技术如:Raid、双机热备等。但这些技术都是在基于增加磁盘的数量的方式来尝试解决问题,降低了数据丢失的概率,但同时大大增加了运维成本,提高了管理的难度。
为此,蚁巡运维平台尝试引入一种新的方式,通过远程实时监控服务器硬盘的健康状态,达到在不增加硬件成本和管理成本的基础上保障数据安全的做法。通过蚁巡运维平台,可以自动发现安装了SMART标准技术的硬盘并远程监控其磁盘的健康指标。
SMART的全称为“Self-Monitoring Analysis and Reporting Technology”,即“自我监测、分析及报告技术”。支持SMART技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。当出现安全值范围以外的情况时,就会自动向用户发出警告。几乎所有主流的硬盘,包括固态硬盘都支持这一技术。但该技术只适用于单机环境,且必须手工获取数据,使用该技术防止硬盘故障的管理成本很高。而在蚁巡中,可以批量的、远程的、实时的监控使用了该技术的硬盘,大大降低了管理成本。
同时,通过蚁巡还可以获得硬盘的使用时间、使用次数等基本指标数据。可以有效的评估硬盘的使用情况,从而进一步评估设备的使用率、寿命等信息。
据统计,通过这项技术,可以提前发现超过60%的硬盘故障,给企业带来的价值无可估量。

请先确定服务器是否有配 RAID。
如果有RAID,请通过对应的RAID管理(监控)工具查看,例如LSI的MegaCli:
# /opt/MegaCli -PDList -aALL
如果没有RAID,通过hdparm命令查看即可,步骤如下:
1、通过fdisk -l列出物理硬盘的设备名称
# fdisk -l
比如看出,共两块硬盘:/dev/hda、/dev/hdd。
2、通过hdparm命令查看指定硬盘的型号
# hdparm -i /dev/hda
# hdparm -i /dev/hdd

首先请检查你的计算机电源部分是否正常连接到了硬盘电源部分,其次请检查一下连接硬盘与主板的数据线是否正确连接,一般和BIOS里的设置无关,因为你的计算机是因为长时间未开机后造成硬盘无法找到的,认不到硬盘用FORMAT命令是没用的,因为FORMAT只是对硬盘的盘面进行格式化而已,意思就是把资料都删除,认不到硬盘的原因很多,包括硬盘的LBA丢失、硬盘主控制芯片烧毁等等,只要你的硬盘没有物理损害(指主板和盘体和硬盘BIOS里的数据未损坏,如果坏了建议你去买个新的吧,有些故障可以修理,就是怕再出问题的时候数据会丢掉)应该是电源线和数据线没有正确连接造成的不认盘。

1,在Raid
1
后,两块盘形成同步Mirroring,这是对于Raid
而言,对于系统而言当然只是认一块盘。
如果您需要Disk
Info,可以在BIOS
或Raid
中查看!
2,Raid
1
,两块磁盘
实时Mirroring
,带Raid完成后,如果因为需要换下某块盘:
一,可以直接把其中一块盘卸掉,在换上另一块盘,他会自动同步。待Server
HDD
light
闪烁一致时,似乎就同步完成了。这个步骤可以在系统运行中 *** 作,前提需要你磁盘背板支持热插拔功能!
二,这个方法适用于
支持热插拔背板和不支持热插拔背板。关机卸掉某块盘,插上新盘,在RaidConfig
选择手动同步(Manual
Sync)!如果在没有选择情况下他自己同步了,那就等到100%,完成!


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13319069.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-14
下一篇 2023-07-14

发表评论

登录后才能评论

评论列表(0条)

保存