服务器监控硬盘状态_服务器

对服务器来说，硬盘因为其机械结构，是最容易出现故障的设备。但恰恰是这最容易出现故障的设备中，存储着对企业来说最至关重要的IT资源——数据。一旦硬盘出现故障，会给企业带来重大的损失。据统计，为了解决硬盘故障带来的损失，目前全球每年的数据恢复市场价值大约在千亿美元——而这仅仅是是企业损失的一小部分。近年来，为了解决这一问题衍生出了大量的技术如：Raid、双机热备等。但这些技术都是在基于增加磁盘的数量的方式来尝试解决问题，降低了数据丢失的概率，但同时大大增加了运维成本，提高了管理的难度。
为此，蚁巡运维平台尝试引入一种新的方式，通过远程实时监控服务器硬盘的健康状态，达到在不增加硬件成本和管理成本的基础上保障数据安全的做法。通过蚁巡运维平台，可以自动发现安装了SMART标准技术的硬盘并远程监控其磁盘的健康指标。
SMART的全称为“Self-Monitoring Analysis and Reporting Technology”，即“自我监测、分析及报告技术”。支持SMART技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。当出现安全值范围以外的情况时，就会自动向用户发出警告。几乎所有主流的硬盘，包括固态硬盘都支持这一技术。但该技术只适用于单机环境，且必须手工获取数据，使用该技术防止硬盘故障的管理成本很高。而在蚁巡中，可以批量的、远程的、实时的监控使用了该技术的硬盘，大大降低了管理成本。
同时，通过蚁巡还可以获得硬盘的使用时间、使用次数等基本指标数据。可以有效的评估硬盘的使用情况，从而进一步评估设备的使用率、寿命等信息。
据统计，通过这项技术，可以提前发现超过60%的硬盘故障，给企业带来的价值无可估量。

请先确定服务器是否有配 RAID。
如果有RAID，请通过对应的RAID管理（监控）工具查看，例如LSI的MegaCli：
# /opt/MegaCli -PDList -aALL
如果没有RAID，通过hdparm命令查看即可，步骤如下：
1、通过fdisk -l列出物理硬盘的设备名称
# fdisk -l
比如看出，共两块硬盘：/dev/hda、/dev/hdd。
2、通过hdparm命令查看指定硬盘的型号
# hdparm -i /dev/hda
# hdparm -i /dev/hdd

首先请检查你的计算机电源部分是否正常连接到了硬盘电源部分，其次请检查一下连接硬盘与主板的数据线是否正确连接，一般和BIOS里的设置无关，因为你的计算机是因为长时间未开机后造成硬盘无法找到的，认不到硬盘用FORMAT命令是没用的，因为FORMAT只是对硬盘的盘面进行格式化而已，意思就是把资料都删除，认不到硬盘的原因很多，包括硬盘的LBA丢失、硬盘主控制芯片烧毁等等，只要你的硬盘没有物理损害（指主板和盘体和硬盘BIOS里的数据未损坏，如果坏了建议你去买个新的吧，有些故障可以修理，就是怕再出问题的时候数据会丢掉）应该是电源线和数据线没有正确连接造成的不认盘。

1,在Raid
1
后，两块盘形成同步Mirroring，这是对于Raid
而言，对于系统而言当然只是认一块盘。
如果您需要Disk
Info，可以在BIOS
或Raid
中查看！
2，Raid
1
,两块磁盘
实时Mirroring
,带Raid完成后，如果因为需要换下某块盘：
一，可以直接把其中一块盘卸掉，在换上另一块盘，他会自动同步。待Server
HDD
light
闪烁一致时，似乎就同步完成了。这个步骤可以在系统运行中 *** 作，前提需要你磁盘背板支持热插拔功能！
二，这个方法适用于
支持热插拔背板和不支持热插拔背板。关机卸掉某块盘，插上新盘，在RaidConfig
选择手动同步（Manual
Sync）！如果在没有选择情况下他自己同步了，那就等到100%，完成！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/13319069.html

服务器监控硬盘状态

发表评论

评论列表（0条）