服务器监控硬盘状态_服务器

对服务器来说，硬盘因为其机械结构，是最容易出现故障的设备。但恰恰是这最容易出现故障的设备中，存储着对企业来说最至关重要的IT资源——数据。一旦硬盘出现故障，会给企业带来重大的损失。据统计，为了解决硬盘故障带来的损失，目前全球每年的数据恢复市场价值大约在千亿美元——而这仅仅是是企业损失的一小部分。近年来，为了解决这一问题衍生出了大量的技术如：Raid、双机热备等。但这些技术都是在基于增加磁盘的数量的方式来尝试解决问题，降低了数据丢失的概率，但同时大大增加了运维成本，提高了管理的难度。
为此，蚁巡运维平台尝试引入一种新的方式，通过远程实时监控服务器硬盘的健康状态，达到在不增加硬件成本和管理成本的基础上保障数据安全的做法。通过蚁巡运维平台，可以自动发现安装了SMART标准技术的硬盘并远程监控其磁盘的健康指标。
SMART的全称为“Self-Monitoring Analysis and Reporting Technology”，即“自我监测、分析及报告技术”。支持SMART技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。当出现安全值范围以外的情况时，就会自动向用户发出警告。几乎所有主流的硬盘，包括固态硬盘都支持这一技术。但该技术只适用于单机环境，且必须手工获取数据，使用该技术防止硬盘故障的管理成本很高。而在蚁巡中，可以批量的、远程的、实时的监控使用了该技术的硬盘，大大降低了管理成本。
同时，通过蚁巡还可以获得硬盘的使用时间、使用次数等基本指标数据。可以有效的评估硬盘的使用情况，从而进一步评估设备的使用率、寿命等信息。
据统计，通过这项技术，可以提前发现超过60%的硬盘故障，给企业带来的价值无可估量。

RAID5数据以块为单位分布到各个硬盘上。不对数据进行备份，而是把数据和与其相对应的奇偶校验信息存储到组成RAID5的各个磁盘上，并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据损坏后，利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。
电脑系统里，你可以查看一下
系统事件查看器
中是否有相应的错误提示。可以考虑
进入阵列BIOS设置中，是否有什么异常的提示。
linux
下的话可以考虑查看磁盘状态，fdisk
-l
注：借鉴了一部分别人的

1、若要查看硬盘剩余空间，首先要登录linux服务

2、打开系统的控制面板，然后输入系统命令“df”，如图所示

3、使用命令“df -lh”，可以更详细地显示磁盘使用情况

4、如果使用命令“df -a ”，则是全部硬盘的使用与剩余情况，如图所示

请先确定服务器是否有配 RAID。
如果有RAID，请通过对应的RAID管理（监控）工具查看，例如LSI的MegaCli：
# /opt/MegaCli -PDList -aALL
如果没有RAID，通过hdparm命令查看即可，步骤如下：
1、通过fdisk -l列出物理硬盘的设备名称
# fdisk -l
比如看出，共两块硬盘：/dev/hda、/dev/hdd。
2、通过hdparm命令查看指定硬盘的型号
# hdparm -i /dev/hda
# hdparm -i /dev/hdd

很多新手用户一样，在选择Linux

VPS主机商的时候会大概看看这款机器是否有人在使用而且大概的口碑和性价比如何，然后大概对比CPU核心、内存、硬盘以及流量在同等认识的商家中是否有一定的性价比优势。虽然经常告诉自己一分钱一分货，但是有些时候还是偏向于尽量希望马儿好也要马儿少吃草的产品。

大部分用户并不能做到各种VPS配置信息以及商家、线路的各种精通，就好比我们购买电脑一样，一些硬件配置我们可能只会知道大概，具体是否兼容以及是否适合我们，我们可能从基本的配置看不到，大部分还是直接用户的体验，尤其是VPS主机无论用来建站还是项目需要，他人使用过的测评信息并不能代表也适合我们，大概范围圈定之后的自我测试是必须的。
稍微深究一些关于Linux

VPS主机的配置信息，不能仅仅就看基本的内存、硬盘和流量，其实玩的深的网友甚至连带硬件信息都会去查看对比，这属于粉丝爱好者了，我们基本上只要玩个大概体验就可以了。在这篇文章中，老左也学着高端一点，把我看到的一些网友有用到查看VPS/服务器环境硬件信息命令记录下来，以后说不定在购买VPS、服务器的时候还可以装专业人士。

第一、CPU参数信息

cat /proc/cpuinfo
第二、Free命令查看内存

free -m
这里我们可以看到当前VPS主机512MB内存，附带64MB Swap存储。

第三、df命令查看硬盘

df -h
这个要对照我们购买VPS、服务器的时候商家给予的配置信息，有些朋友说购买的30GB，为什么看到的是10GB，还有20GB去哪里了呢？还有的是挂载盘需要我们单独挂载才可以出来，用fdisk -l就可以看到还有20GB没有挂载，在这台测试机中直接在一个盘里没有挂载盘。

第四、Inxi查看硬件信息

inxi -Fx

这个Inxi工具我也第一次用到过，看到介绍很强大，可以查看所有的服务器硬件信息，一般默认发行版本中是没有安装的，这里我在Debian环境中自己安装的。

安装Inxi For Debian/Ubuntu

echo 'deb >参考这个软件raid：只能通过Linux系统本身来查看《Linux就该这么学》有Linux命令大全
cat /proc/mdstat
可以看到raid级别，状态等信息。
硬件raid：最佳的办法是通过已安装的raid厂商的管理工具来查看，有cmdline，也有图形界面。如Adaptec公司的硬件卡就可以通过下面的命令进行查看：
# /usr/dpt/raidutil -L all
可以看到非常详细的信息。
当然更多情况是没有安装相应的管理工具，只能依靠Linux本身的话一般我知道的是两种方式：
# dmesg |grep -i raid
# cat /proc/scsi/scsi
显示的信息差不多，raid的厂商，型号，级别，但无法查看各块硬盘的信息。
另外经过实际测试，Dell的服务器可以通过命令来显示，而HP、IBM等的服务器通过上面的命令是显示不出的。只能够通过装硬件厂商的管理工具来查看DELL的BMC可以查看。
cat /proc/scsi/scsi
可以看到是SCSI上的设备。一般情况可以看到RAID级别。lspci可以看到RAID卡的型号。

1，Linux下可以在/proc/cpuinfo中看到每个cpu的详细信息。但是对于双核的cpu，在cpuinfo中会看到两个cpu。常常会让人误以为是两个单核的cpu。
其实应该通过Physical Processor ID来区分单核和双核。而Physical Processor ID可以从cpuinfo或者dmesg中找到 flags 如果有 ht 说明支持超线程技术判断物理CPU的个数可以查看physical id 的值，相同则为同一个物理CPU
2，查看内存大小:
cat /proc/meminfo |grep MemTotal
3，其他一些可以查看详细linux系统信息的命令和方法:
uname -a # 查看内核/ *** 作系统/CPU信息的linux系统信息命令
head -n 1 /etc/issue # 查看 *** 作系统版本，是数字1不是字母L
cat /proc/cpuinfo # 查看CPU信息的linux系统信息命令
hostname # 查看计算机名的linux系统信息命令
lspci -tv # 列出所有PCI设备
lsusb -tv # 列出所有USB设备的linux系统信息命令
lsmod # 列出加载的内核模块
env # 查看环境变量资源
free -m # 查看内存使用量和交换区使用量
df -h # 查看各分区使用情况
du -sh # 查看指定目录的大小
grep MemTotal /proc/meminfo # 查看内存总量
grep MemFree /proc/meminfo # 查看空闲内存量
uptime # 查看系统运行时间、用户数、负载
cat /proc/loadavg # 查看系统负载磁盘和分区
mount | column -t # 查看挂接的分区状态
fdisk -l # 查看所有分区
swapon -s # 查看所有交换分区
hdparm -i /dev/hda # 查看磁盘参数(仅适用于IDE设备)
dmesg | grep IDE # 查看启动时IDE设备检测状况网络
ifconfig # 查看所有网络接口的属性
iptables -L # 查看防火墙设置
route -n # 查看路由表
netstat -lntp # 查看所有监听端口
netstat -antp # 查看所有已经建立的连接
netstat -s # 查看网络统计信息进程
ps -ef # 查看所有进程
top # 实时显示进程状态用户
w # 查看活动用户
id # 查看指定用户信息
last # 查看用户登录日志
cut -d: -f1 /etc/passwd # 查看系统所有用户
cut -d: -f1 /etc/group # 查看系统所有组
crontab -l # 查看当前用户的计划任务服务
chkconfig –list # 列出所有系统服务
chkconfig –list | grep on # 列出所有启动的系统服务程序
rpm -qa # 查看所有安装的软件包
cat /proc/cpuinfo ：查看CPU相关参数的linux系统命令
cat /proc/partitions ：查看linux硬盘和分区信息的系统信息命令
cat /proc/meminfo ：查看linux系统内存信息的linux系统命令
cat /proc/version ：查看版本，类似uname -r
cat /proc/ioports ：查看设备io端口
cat /proc/interrupts ：查看中断
cat /proc/pci ：查看pci设备的信息
cat /proc/swaps ：查看所有swap分区的信息

大致结果类似下图：

Mem行（单位均为M）：

(-/+ buffers/cache)行：

Swap行指交换分区。

实际上不要看free少就觉得内存不足了，buffers和cached都是可以在使用内存时拿来用的，应该以(-/+ buffers/cache)行的free和used来看。只要没发现swap的使用，就不用太担心，如果swap用了很多，那就要考虑增加物理内存了。

大致结果类似下图：

上方文字部分的红框为总的CPU占用百分率，下方的表格是每个进程的CPU占用率，在表格第一行可以看到红框中占用率超过了150%，这是因为服务器是多核CPU，而该进程使用了多核。

大致结果类似下图：

表格中会显示显卡的一些信息，第一行是版本信息，第二行是标题栏，第三行就是具体的显卡信息了，如果有多个显卡，会有多行，每一行的信息值对应标题栏对应位置的信息。

需要注意的一点是显存占用率和GPU占用率是两个不一样的东西，类似于内存和CPU，两个指标的占用率不一定是互相对应的。

在下面就是每个进程使用的GPU情况了。

大致结果如下图：

表格中每一行代表一个文件系统，各列意义如下：

要查看具体某个文件或者文件夹的大小的话，可以使用下面的命令：

du命令可以查看文件或文件夹的磁盘使用空间，而-h参数的意思是使用GB、MB等易读的格式。如果不带--max-depth参数，那么将循环列出文件夹下所有文件和文件夹占用的空间，带此参数，则是指定深入目录的层数。

如果要看文件夹下所有文件的大小，可以使用：

查看作者首页

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/12815192.html

服务器监控硬盘状态

发表评论

评论列表（0条）