linux系统平均负载,数值是什么意思?

linux系统平均负载,数值是什么意思?,第1张

系统平均负载被定义为在特定时间间隔内运行队列中的平均进程树。如果一个进程满足以下条件则其就会位于运行队列中:- 它没有在等待I/O *** 作的结果- 它没有主动进入等待状态(也就是没有调用'wait')- 没有被停止(例如:等待终止)例如:[root@www2 init.d]# uptime 7:51pm up 2 days, 5:43, 2 users,load average: 8.13 , 5.90 , 4.94 命令输出的最后内容表示在过去的1 、5 、15分钟内运行队列中的平均进程数量。一般来说只要每个CPU 的当前活动进程数不大于3 那么系统的性能就是良好的,如果每个CPU 的任务数大于5 ,那么就表示这台机器的性能有严重问题。对于上面的例子来说,假设系统有两个CPU ,那么其每个CPU 的当前任务数为:8.13/2=4.065.这表示该系统的性能是可以接受的。

1、查看Linux系统CPU个数

2、每次发现系统变慢时,我们通常做的第一件事,就是执行top或者uptime命令

2.1、如果1分钟、5分钟、15分钟的三个值基本相同,或者相差不大,那就说明系统负载很平稳。​

2.2、但如果1分钟的值远小于15 分钟的值,就说明系统最近1分钟的负载在减少,而过去15分钟内却有很大的负载。

2.3、反过来,如果1分钟的值远大于 15 分钟的值,就说明最近1分钟的负载在增加,这种增加有可能只是临时性的,也有可能还会持续增加下去,所以就需要持续观察。一旦1分钟的平均负载接近或超过了CPU的个数,就意味着系统正在发生过载的问题,这时就得分析调查是哪里导致的问题,并要想办法优化了。

​​eg:假设我们在一个单 CPU 系统上看到平均负载为 1.73,0.60,7.98,那么说明在过去 1 分钟内,系统有 73% 的超载,而在 15 分钟内,有 698% 的超载,从整体趋势来看,系统的负载在降低。​ ​

2.4、当平均负载高于 CPU 数量70%的时候,你就应该分析排查负载高的问题了。一旦负载过高,就可能导致进程响应变慢,进而影响服务的正常功能。​

2.5、CPU 使用率,是单位时间内 CPU 繁忙情况的统计,跟平均负载并不一定完全对应

2.5.1、CPU 密集型进程,使用大量 CPU 会导致平均负载升高,此时这两者是一致的;

2.5.2、I/O 密集型进程,等待 I/O 也会导致平均负载升高,但 CPU 使用率不一定很高;

2.5.3、大量等待 CPU 的进程调度也会导致平均负载升高,此时的CPU使用率也会比较高。

3、使用工具iostat(stress)、mpstat、pidstat 等工具,找出平均负载升高的根源

3.1、stress 是一个 Linux 系统压力测试工具,这里我们用作异常进程模拟平均负载升高的场景​​

3.2、而 sysstat 包含了常用的 Linux 性能工具,用来监控和分析系统的性能。我们的案例会用到这个包的两个命令 mpstat 和 pidstat。​

3.2.1、mpstat 是一个常用的多核 CPU 性能分析工具,用来实时查看每个 CPU 的性能指标,以及所有CPU的平均指标。

3.2.2、pidstat 是一个常用的进程性能分析工具,用来实时查看进程的 CPU、内存、I/O 以及上下文切换等性能指标

首先,在第一个终端运行 stress 命令,模拟一个 CPU 使用率 100% 的场景

接着,在第二个终端运行uptime查看平均负载的变化情况

最后,在第三个终端运行mpstat查看 CPU 使用率的变化情况

那么到底是哪个进程,导致 iowait 这么高呢?我们还是用 pidstat 来查询

首先还是运行 stress 命令,但这次模拟 I/O 压力,即不停地执行 sync

还是在第二个终端运行uptime查看平均负载的变化情况

然后,第三个终端运行mpstat查看 CPU 使用率的变化情况

那么到底是哪个进程,导致 iowait 这么高呢?我们还是用 pidstat 来查询

当系统中运行进程超出 CPU 运行能力时,就会出现等待 CPU 的进程。比如,我们还是使用 stress,但这次模拟的是 4 个进程

由于系统只有 1 个CPU,明显比 4 个进程要少得多,因而,系统的 CPU 处于严重过载状态,平均负载高达3.71

接着再运行pidstat来看一下进程的情况

linux

uptime命令主要用于获取主机运行时间和查询linux系统负载等信息。uptime命令过去只显示系统运行多久。现在,可以显示系统已经运行了多长时间,信息显示依次为:现在时间、系统已经运行了多长时间、目前有多少登陆用户、系统在过去的1分钟、5分钟和15分钟内的平均负载。

51CTO编辑推荐:linux监控工具大全

uptime命令用法十分简单:直接输入

#

uptime

即可。

输入样例:

18:02:41

up

41

days,

23:42,

1

user,

load

average:

0.00,

0.00,

0.00

1可以被认为是最优的负载值。负载是会随着系统不同改变得。单CPU系统1-3和SMP系统6-10都是可能接受的。

另外还有一个参数

-V

,是用来查询版本的。

(注意是大写的字母v)

[linux

@

localhost]$

uptime

-V

procps

version

3.2.7

[linux

@

localhost]$

uptime

显示结果为:

10:19:04

up

257

days,

18:56,

12

users,

load

average:

2.10,

2.10,2.09

显示内容说明:

10:19:04

//系统当前时间

up

257

days,

18:56

//主机已运行时间,时间越大,说明你的机器越稳定。

12

user

//用户连接数,是总连接数而不是用户数

load

average

//

系统平均负载,统计最近1,5,15分钟的系统平均负载

那么什么是系统平均负载呢?

系统平均负载是指在特定时间间隔内运行队列中的平均进程数。

如果每个CPU内核的当前活动进程数不大于3的话,那么系统的性能是良好的。如果每个CPU内核的任务数大于5,那么这台机器的性能有严重问题。

如果你的linux主机是1个双核CPU的话,当Load

Average

为6的时候说明机器已经被充分使用了。

作者开源运维研究室


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7377082.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-04
下一篇 2023-04-04

发表评论

登录后才能评论

评论列表(0条)

保存