有什么监控Linux服务器的工具吗？_系统运维

1、Ganglia

是一个集群监控软件，可以监视和显示集群中的节点的各种状态信息，比如：CPU、mem、硬盘利用率、I/O负载、网络流量情况等，同时可以将历史数据以曲线方式通过php页面呈现，此软件主要是用来监控系统性能的软件，通过曲线可以很容易见到每个节点的工作状态，对合理调整、分配系统资源，提高系统整体性能起到重要作用。

它是分布式的监控系统，有两个Daemon，是一个Linux下图形化监控系统运行性能的软件，界面美观、丰富，功能强大。

RRDtool是系统存放和显示time-series (即网络带宽、温度、人数、服务器负载等) 。并且它提出有用的图表由处理数据强制执行有些数据密度。

2、Cacti

是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具，通过snmpget来获取数据，使用RRDTool绘画图形，提供了非常强大的数据和用户管理功能，可以指定每一个用户能查看树状结构、host以及任何一张图，还可以与LDAP结合进行用户验证，同时也能自己增加模板，功能非常强大完善。

cacti是用php语言实现的一个软件，它的主要功能是用snmp服务获取数据，然后用rrdtool储存和更新数据，当用户需要查看数据的时候用rrdtool生成图表呈现给用户。因此，snmp和rrdtool是cacti的关键。

3、Zenoss

是一款智能监控软件，允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core同时也是开源的网络与系统管理软件。

Zenoss提供功能丰富的产品，以监测整个IT基础设施：

网络 -路由器，交换机，防火墙，接入点

服务器 -微软的Windows ， Linux ， Unix系统，惠普， NetApp，戴尔

虚拟化 -完整虚拟机虚拟化基础架构( VI3 )管理， XenSource监测

应用领域 -Process(程序)，Port，网络应用服务， Web服务，数据库，中间件，商业企业应用方案

4、Argus

是一个网络连接监控器，可以利用它来定制监控网络中符合某种条件的计算机，例如网络空闲、断开等。

5、Monit

是一款功能非常丰富的进程、文件、目录和设备的监测软件，用于UNIX平台，可以自动修复那些已经停止运行的程序，适合处理那些由于多种原因导致的软件错误。

6、Nagios

是一个监视系统运行状态和网络信息的监视系统，能监视所指定的本地或远程主机以及服务，同时提供异常通知功能等Nagios可运行在Linux/Unix平台之上，同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态，各种系统问题，以及日志等等。

Nagios的主要功能特点：

监视网络服务(SMTP、POP3、HTTP、NNTP、PING等)

监视主机资源(进程、磁盘等)

简单的插件设计可以轻松扩展Nagios的监视功能

服务等监视的并发处理

错误通知功能(通过email、pager或其他用户自定义的方法)。

1.uptime

该命令直观的显示了服务器在过去15分钟，5分钟，1分钟内的平均负载

2.vmstat

每隔2秒输出vmstat的信息，共输出10次。

类别

procs

swap

system

cpu

r：正在运行的进程数目

si：

换入到内存的容量

bi：

读入块数目

in：

中断数目

us：用户

b：阻塞的进程数目

so：

换出内存的容量

bo：

写到块数目

cs：

上下文切换数目

sy：系统

id：空闲

wa：等待io完成的cpu

3.iostat

每隔2秒输出iostat信息，共输出3次

tps

blk_read/s

blk_wrtn/s

blk_read

blk_wrtn

发送磁盘的I/O请求数

每秒读取的block数量

每秒写的block数量

读入block的总数

写入block的总数

备注：该命令包含了cpu信息和磁盘IO信息，这里简单介绍下有关磁盘IO的几个参数。需要注意的是，第一次blk_read和blk_wrtn是统计的历史总数，后面是每一秒的变化数。

4.top

top

-d

每10秒钟查看下信息。

包含了load信息，系统运行时间信息，cpu信息，进程信息等。

5.free

-m

total：内存总量，

used：表示总计分配给缓存(包含buffers

与cache

)使用的数量，但其中可能部分缓存并未实际使用

free：未分配的内存

buffers：系统分配但未被使用的buffers

数量

cached：系统分配但未被使用的cache

数量

======buffers/cache行=====

used：Mem行中的used

buffers-cached，实际使用的内存总量

free：

未被使用的buffers

与cache

和未被分配的内存之和，这就是系统当前实际可用内存。

6.sar

通过sar命令可以查看服务器的各个硬件的实时运转情况。由于显示的一些参数含义与其它命令类似，这里就不一一详细介绍，只重点介绍

几个参数。

(1)sar

-d

显示磁盘实时信息

(2)sar

-b

查看I/O和传送速率的统计信息

(3)sar

-u

显示cpu实时信息

(4)sar

-q

查看平均负载

(5)sar

-r

查看内存使用情况

(6)sar

-n

DEV

查看网卡流量情况

rxpck/s：每秒钟接收的数据包

txpck/s：每秒钟发送的数据包

rxbyt/s：每秒钟接收的字节数

txbyt/s：每秒钟发送的字节数

rxcmp/s：每秒钟接收的压缩数据包

txcmp/s：每秒钟发送的压缩数据包

rxmcst/s：每秒钟接收的多播数据包

1. sar

每两秒刷新一次，总共5次

[root@dbhost01 ~]# sar 2 5

Linux 2.6.32-504.el6.x86_64 (dbhost01) 03/30/2018 _x86_64_ (4 CPU)

02:53:15 PM CPU %user %nice %system %iowait%steal %idle

02:53:17 PM all 0.66 0.00 1.72 0.66 0.00 96.96

02:53:19 PM all 1.34 0.00 3.35 0.80 0.00 94.51

02:53:21 PM all 0.79 0.00 1.59 1.45 0.00 96.17

02:53:23 PM all 0.40 0.00 2.00 0.80 0.00 96.80

02:53:25 PM all 0.66 0.00 1.85 0.79 0.00 96.70

Average:all 0.77 0.00 2.10 0.90 0.00 96.23

2. top

top -a 按照内存降序

[root@dbhost01 ~]# top -a

top - 15:00:54 up 6:04, 1 user, load average: 0.31, 0.19, 0.11

Tasks: 306 total, 1 running, 305 sleeping, 0 stopped, 0 zombie

Cpu(s): 7.8%us, 2.4%sy, 0.0%ni, 88.9%id, 0.8%wa, 0.0%hi, 0.1%si, 0.0%st

Mem: 4048972k total, 3848576k used, 200396k free, 134844k buffers

Swap: 4194300k total, 1788k used, 4192512k free, 1835360k cached

3. vmstat

vmstat用于显示虚拟内存，内核线程，磁盘，系统进程， CPU活动等统计信息。

需要安装sysstat工具。

[root@dbhost01 ~]# vmstat

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si sobibo in cs us sy id wa st

2 0 1788 202508 135064 1835920003226 96 276 1 2 95 1 0

[root@dbhost01 ~]#

[root@dbhost01 ~]# vmstat 2 5

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si sobibo in cs us sy id wa st

0 0 1788 202336 135068 1836000003226 97 276 1 2 95 1 0

0 0 1788 202624 135068 1836000002529 4012 6682 0 1 98 1 0

0 0 1788 202624 135072 1836004005787 4003 6685 0 1 98 1 0

1 0 1788 202508 135072 1836004005733 4402 7353 1 1 98 0 0

0 0 1788 202540 135076 1836004003347 4002 6674 0 1 98 1 0

4. lsof(list open files)

[root@dbhost01 ~]# lsof | grep 1521

certmonge 2348 root 16r FIFO0,8 0t0 15212 pipe

certmonge 2348 root 18r FIFO0,8 0t0 15218 pipe

gipcd.bin 2754 grid 109u unix 0xffff880139152180 0t0 36936 socket

5. tcpdump

tcpdump -i eth1

15:24:28.777779 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 393080:393596, ack 105, win 148, options [nop,nop,TS val 22996360 ecr 2443327], length 516

15:24:28.777809 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 393080:393596, ack 105, win 148, options [nop,nop,TS val 22996360 ecr 2443327], length 516

15:24:28.778976 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 393596:393968, ack 105, win 148, options [nop,nop,TS val 22996361 ecr 2443327], length 372

15:24:28.779011 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 393596:393968, ack 105, win 148, options [nop,nop,TS val 22996361 ecr 2443327], length 372

15:24:28.779013 IP 192.168.2.82.50990 >dbhost01.ssh: Flags [.], ack 393968, win 16652, options [nop,nop,TS val 2443327 ecr 22996360], length 0

15:24:28.779481 IP dbhost02-priv.23602 >dbhost01-priv.24271: UDP, length 556

15:24:28.779585 IP dbhost01-priv.24271 >dbhost02-priv.23602: UDP, length 80

15:24:28.779909 IP dbhost01-priv.24271 >dbhost02-priv.23602: UDP, length 80

15:24:28.780584 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 393968:394724, ack 105, win 148, options [nop,nop,TS val 22996362 ecr 2443327], length 756

15:24:28.780590 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 393968:394724, ack 105, win 148, options [nop,nop,TS val 22996362 ecr 2443327], length 756

15:24:28.780820 IP dbhost01-priv.24271 >dbhost02-priv.23602: UDP, length 556

15:24:28.782232 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 394724:395176, ack 105, win 148, options [nop,nop,TS val 22996364 ecr 2443327], length 452

15:24:28.782235 IP dbhost01.ssh >192.168.2.82.50990: Flags [P.], seq 394724:395176, ack 105, win 148, options [nop,nop,TS val 22996364 ecr 2443327], length 452

6.netstat

[root@dbhost01 ~]# netstat -a | grep oracle

unix 2 [ ACC ] STREAM LISTENING 31861 /var/tmp/.oracle/ora_gipc_sdbhost01gridmyracdb-clusterCRFM_SIPC

unix 2 [ ACC ] STREAM LISTENING 33820 /var/tmp/.oracle/sdbhost01DBG_LOGD

unix 2 [ ACC ] STREAM LISTENING 41177 /var/tmp/.oracle/sdbhost01DBG_EVMD

unix 2 [ ACC ] STREAM LISTENING 65106 /var/tmp/.oracle/sAevm

unix 2 [ ACC ] STREAM LISTENING 65108 /var/tmp/.oracle/sSYSTEM.evm.acceptor.auth

7. htop

需要安装

8. iostat

Total DISK READ: 91.48 K/s | Total DISK WRITE: 45.27 K/s

TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND

4071 be/4 oracle 30.18 K/s0.00 B/s 0.00 % 4.69 % ora_lmon_orcl1

4117 be/4 oracle 60.36 K/s 15.09 K/s 0.00 % 3.69 % ora_ckpt_orcl1

2989 rt/4 grid 965.71 B/s0.00 B/s 0.00 % 2.13 % ocssd.bin

4099 be/4 oracle 0.00 B/s 30.18 K/s 0.00 % 0.07 % ora_ckpt_test

2987 rt/4 grid0.00 B/s 482.86 B/s 0.00 % 0.03 % ocssd.bin

2979 rt/3 root0.00 B/s3.77 K/s 0.00 % 0.00 % ologgerd -M -d /g01/grid/app/11.2.0/grid/crf/db/dbhost01

2980 rt/3 root0.00 B/s 15.09 K/s 0.00 % 0.00 % ologgerd -M -d /g01/grid/app/11.2.0/grid/crf/db/dbhost01

9. iftop(流量监控工具)

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/yw/8676353.html

有什么监控Linux服务器的工具吗？

发表评论

评论列表（0条）