Linux TOP命令按内存占用排序和按CPU占用排序

Linux TOP命令按内存占用排序和按CPU占用排序,第1张

Linux存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。下面让我们一起去了解Linux TOP命令 按内存占用排序和按CPU占用排序。

   Linux TOP命令 按内存占用排序和按CPU占用排序:

:在命令行提示符执行top命令

2:输入大写P,则结果按CPU占用降序排序。输入大写M,结果按内存占用降序排序。(注:大写P可以在capslock状态输入p,或者按Shift+p)

另外:

认识top的显示结果

top命令的显示结果如下所示:

top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48 Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombie Cpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0% wa, 0.0% hi, 0.0% si Mem: 191272k total, 173656k used, 17616k free, 22052k buffers Swap: 192772k total, 0k used, 192772k free, 123988k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 1379 root 16 0 7976 2456 1980 S 0.7 1.3 0:11.03 sshd 14704 root 16 0 2128 980 796 R 0.7 0.5 0:02.72 top 1 root 16 0 1992 632 544 S 0.0 0.3 0:00.90 init 2 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0 3 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0统计信息区

前五行是系统整体的统计信息。第一行是任务队列信息,同 uptime 命令的执行结果。其内容如下:

01:06:48当前时间

up 1:22系统运行时间,格式为时:分

1 user当前登录用户数

load average: 0.06, 0.60, 0.48系统负载,即任务队列的平均长度。

三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。

第二、三行为进程和CPU的信息。当有多个CPU时,这些内容可能会超过两行。内容如下:

Tasks: 29 total进程总数

1 running正在运行的进程数

28 sleeping睡眠的进程数

0 stopped停止的进程数

0 zombie僵尸进程数

Cpu(s): 0.3% us用户空间占用CPU百分比

1.0% sy内核空间占用CPU百分比

0.0% ni用户进程空间内改变过优先级的进程占用CPU百分比

98.7% id空闲CPU百分比

0.0% wa等待输入输出的CPU时间百分比

0.0% hi

0.0% si

最后两行为内存信息。内容如下:

Mem: 191272k total物理内存总量

173656k used使用的物理内存总量

17616k free空闲内存总量

22052k buffers用作内核缓存的内存量

Swap: 192772k total交换区总量

0k used使用的交换区总量

192772k free空闲交换区总量

123988k cached缓冲的交换区总量。

内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,

该数值即为这些内容已存在于内存中的交换区的大小。

相应的内存再次被换出时可不必再对交换区写入。

进程信息区

统计信息区域的下方显示了各个进程的详细信息。首先来认识一下各列的含义。

序号列名含义

aPID进程id

bPPID父进程id

cRUSERReal user name

dUID进程所有者的用户id

eUSER进程所有者的用户名

fGROUP进程所有者的组名

gTTY启动进程的终端名。不是从终端启动的进程则显示为 ?

hPR优先级

iNInice值。负值表示高优先级,正值表示低优先级

jP最后使用的CPU,仅在多CPU环境下有意义

k%CPU上次更新到现在的CPU时间占用百分比

lTIME进程使用的CPU时间总计,单位秒

mTIME+进程使用的CPU时间总计,单位1/100秒

n%MEM进程使用的物理内存百分比

oVIRT进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES

pSWAP进程使用的虚拟内存中,被换出的大小,单位kb。

qRES进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA

rCODE可执行代码占用的物理内存大小,单位kb

sDATA可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb

tSHR共享内存大小,单位kb

unFLT页面错误次数

vnDRT最后一次写入到现在,被修改过的页面数。

wS进程状态。

D=不可中断的睡眠状态

R=运行

S=睡眠

T=跟踪/停止

Z=僵尸进程

xCOMMAND命令名/命令行

yWCHAN若该进程在睡眠,则显示睡眠中的系统函数名

zFlags任务标志,参考 sched.h

默认情况下仅显示比较重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通过下面的快捷键来更改显示内容。

更改显示内容

通过 f 键可以选择显示的内容。按 f 键之后会显示列的列表,按 a-z 即可显示或隐藏对应的列,最后按回车键确定。

按 o 键可以改变列的显示顺序。按小写的 a-z 可以将相应的列向右移动,而大写的 A-Z 可以将相应的列向左移动。最后按回车键确定。

按大写的 F 或 O 键,然后按 a-z 可以将进程按照相应的列进行排序。而大写的 R 键可以将当前的排序倒转。

Linux新手,个人认为首先就应该了解一下top命令各项的含义.

不用有事就问什么搜索引擎,先看看man top.

top - 16:12:56 up 1 day, 22 min, 4 users, load average: 0.02, 0.04, 0.05

Tasks: 158 total, 1 running, 156 sleeping, 0 stopped, 1 zombie

%Cpu(s): 0.7 us, 0.3 sy, 0.0 ni, 98.8 id, 0.1 wa, 0.0 hi, 0.0 si, 0.0 st

KiB Mem: 1017912 total, 895892 used, 122020 free,15312 buffers

KiB Swap: 1045500 total,19608 used, 1025892 free. 230012 cached Mem

PID USER PR NIVIRTRESSHR S %CPU %MEM TIME+ COMMAND

5761 eechen20 0 32144 1548 1076 R 6.2 0.2 0:00.01 top

16:12:56 up 1 day, 22 min, 4 users, load average: 0.02, 0.04, 0.05

这句等同于执行 uptime 命令返回的内容.

16:12:56 是当前时间(date).

up 1 day, 22 min 表示系统已经运行1天又22分钟(uptime -p).

4 users 表示当前登录系统的用户(w,who).

load average 表示系统负载,分别是1分钟,5分钟,15分钟前到现在的负载平均值.

Tasks: 158 total 表示系统的进程数(数目等于ps -ef|wc -l的值减去2),按大写H可以切换到线程模式.

running表示正在运行的进程,sleeping表示睡眠的进程,stopped表示暂停的进程,zombie表示已结束但还没有从进程表中删除的僵尸进程.

total表示总内存,used表示已经使用的内存,free表示空闲的内存,按E可以切换单位.

buffers(Buffer Cache)表示块设备的读写缓冲区占用的内存,cached(Page Cache)表示文件系统缓存占用的内存.

buffers:块设备缓冲 cached:文件系统缓存

如果cached的值很大,说明cache住的文件数很多.如果频繁访问到的文件都能被cache住,那么磁盘的读I/O就非常小.

所谓块设备是指对其信息的存取以"块"为单位,如通常的光盘,硬磁盘,软磁盘,磁带等,块长取512字节或1024字节或4096字节.

块设备可以直接通过块设备特别文件来访问,为了提高数据传输效率,块设备驱动程序内部采用块缓冲技术.

Swap是交换空间,交换空间在物理内存(RAM)被充满时被使用.

如果系统需要更多的内存资源,而物理内存已经充满,内存中不活跃的页就会被移到交换空间去.

虽然交换空间可以为带有少量内存的机器提供帮助,但是这种方法不应该被当做是对内存的取代.

交换空间位于硬盘驱动器上,它比进入物理内存要慢.

load average的理解:

load average指的是处于task_running或task_uninterruptible状态的进程(或线程)数的平均值.

处于task_running状态的进程(或线程),可能正在使用CPU或排队等待使用CPU.

处于task_uninterruptible状态的进程(或线程),可能正在等待I/O,比如等待磁盘I/O.这时I/O等待占用的CPU时间百分比iowait(wa)可能会比较高.

sudo strace -p `pidof top` 可见top从/proc读取了很多信息.

man proc 查看 /proc/loadavg 的说明:

man proc | col -b >proc.txt

/proc/loadavg 内容:

0.22 0.13 0.14 2/374 5306

0.22 0.13 0.14表示在过去的1分钟,5分钟,15分钟,

正在运行(task_running)或等待IO(task_uninterruptible)的任务的数量.

2/374中的2表示当前运行的线程数,374则表示系统当前存在的内核调度实体(进程/线程)的数量.

5306是系统最近创建的进程PID编号.

又比如:

load average: 31.09, 29.87, 29.92

表示在过去的1分钟,5分钟,15分钟的时间里,CPU任务队列中平均有30个程序(这里应该是30个Java线程)在使用CPU.

PID USER PR NIVIRTRESSHR S %CPU %MEM TIME+ COMMAND

20248 root 20 0 0.227t 0.012t 18748 S 3090 5.2 29812:58 java

Java进程的CPU使用率%CPU达到3090%,表示这个Java进程正在使用31个CPU核心,

这样对上了上面load average得出的数据,也就是有30个左右的Java线程正在使用30个CPU核心.

按H(区分大小写)切换到线程模式,因为一个线程最多只能使用一个核心,所以线程模式下显示的CPU使用率不会超过100%.

当CPU和磁盘都忙不过来的时候,开再多的进程也没有任何意义,只会徒增CPU上下文切换和磁盘I/O等待,得不偿失.

系统负载高,普遍是因为系统进程数太多,I/O太多导致的.

load average小于1表示系统空闲,大于1表示系统开始繁忙.

Linux服务器的任务(进程)数量保持在200个以下是比较好的,最好不要超过300个.

us, user : time running un-niced user processes 用户空间进程占用CPU时间百分比

sy, system : time running kernel processes 内核进程占用CPU时间百分比

ni, nice : time running niced user processes 用户空间内改变过优先级的进程占用CPU时间百分比

id, idle : time spent in the kernel idle handler 空闲CPU时间百分比(100%表示系统完全空闲)

wa, iowait : time waiting for I/O completion I/O等待占用的CPU时间百分比

hi : time spent servicing hardware interrupts 硬件中断占用CPU时间百分比

si : time spent servicing software interrupts 软件中断占用CPU时间百分比

st : time stolen from this vm by the hypervisor 虚拟化hypervisor从当前虚拟机vm偷走的时间

如果st这个值很高的话,说明你的VPS提供商的CPU资源有限,而你没能抢过别人,很有可能就是VPS提供商超售了.

按F选择要显示的列和查看每列的含义,默认有下面这些列:

PID = Process Id

USER= Effective User Name

PR = Priority PR和NI的值越高越友好即越不竞争资源,比如PR 20和NI 0,另外,PR=NI+20.

NI = Nice Value 负值表示高优先级,正值表示低优先级,比如kworker的NI为-20,PR为0.

VIRT= Virtual Image (KiB)

RES = Resident Size (KiB) 常驻内存,按E切换单位.

SHR = Shared Memory (KiB)

S = Process Status

%CPU= CPU Usage 四核处理器在Tasks模式下满载为400%,在Threads模式(按H切换)下满载为100%(一个线程最多只能使用一个核心).按Shift+P按CPU使用率排序.

%MEM= Memory Usage (RES) 满载为100%,按Shift+M按RES内存排序.

TIME+ = CPU Time, hundredths 进程使用的CPU时间总计.比如2:32.45代表2分钟32.45秒.

COMMAND = Command Name/Line

按F进入域管理窗口后按A可以切换显示模式,按空格选中要显示的列,按S按指定列排序,用向右方向键选中列后可以调整顺序.修改后按Shift+W保存设置到~/.toprc文件.

top里面按Shift+M是按内存排序,按E是切换内存单位,按Shfit+W保存设置.

然后执行top -n1 -b可以看到按内存排序的所有进程的信息.

或者ps后用sort排序:

ps aux | sort -k4nr | head -n5

top里按C或者使用-c参数可以看到进程的绝对路径和启动参数,就可以得到类似ps -ef和ps aux提供的信息了.

看进程路径: top -p `pidof firefox` -c -n1

看进程线程: top -p `pidof firefox` -H -n1

Linux Process Status:

http://blog.csdn.net/tianlesoftware/article/details/6457487

R (task_running) : 可执行状态

S (task_interruptible): 可中断的睡眠状态

D (task_uninterruptible): 不可中断的睡眠状态

T (task_stopped or task_traced): 暂停状态或跟踪状态

Z (task_dead - exit_zombie): 退出状态,进程成为僵尸进程

X (task_dead - exit_dead): 退出状态,进程即将被销毁

running进程:

只有在该状态的进程才可能在CPU上运行。

而同一时刻可能有多个进程处于可执行状态,这些进程的task_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。

进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。

很多 *** 作系统教科书将正在CPU上执行的进程定义为RUNNING状态、而将可执行但是尚未被调度执行的进程定义为READY状态,这两种状态在Linux下统一为TASK_RUNNING状态。

sleeping进程:

处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。

这些进程的task_struct结构被放入对应事件的等待队列中。当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。

通过ps命令我们会看到,一般情况下,进程列表中的绝大多数进程都处于task_interruptible状态(除非机器的负载很高)。

毕竟CPU就这么一两个,进程动辄几十上百个,如果不是绝大多数进程都在睡眠,CPU又怎么响应得过来。

stopped进程:

向进程发送一个sigstop信号,它就会因响应该信号而进入task_stopped状态,除非该进程本身处于task_uninterruptible状态而不响应信号。

sigstop与sigkill信号一样,是非常强制的。不允许用户进程通过signal系列的系统调用重新设置对应的信号处理函数。

向进程发送一个sigcont信号,可以让其从task_stopped状态恢复到task_running状态。

当进程正在被跟踪时,它处于task_traced这个特殊的状态。“正在被跟踪”指的是进程暂停下来,等待跟踪它的进程对它进行 *** 作。

比如在gdb中对被跟踪的进程下一个断点,进程在断点处停下来的时候就处于task_traced状态。而在其他时候,被跟踪的进程还是处于前面提到的那些状态。

对于进程本身来说,task_stopped和task_traced状态很类似,都是表示进程暂停下来。

而task_traced状态相当于在task_stopped之上多了一层保护,处于task_traced状态的进程不能响应sigcont信号而被唤醒。

只能等到调试进程通过ptrace系统调用执行ptrace_cont、ptrace_detach等 *** 作(通过ptrace系统调用的参数指定 *** 作),或调试进程退出,被调试的进程才能恢复task_running状态。

zombie进程:

在Linux进程的状态中,僵尸进程是非常特殊的一种,它是已经结束了的进程,但是没有从进程表中删除。

太多了会导致进程表里面条目满了,进而导致系统崩溃,倒是不占用其他系统资源。

它已经放弃了几乎所有内存空间,没有任何可执行代码,也不能被调度,

仅仅在进程列表中保留一个位置,记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有任何内存空间。

进程在退出的过程中,处于TASK_DEAD状态。在这个退出过程中,进程占有的所有资源将被回收,除了task_struct结构(以及少数资源)以外。

于是进程就只剩下task_struct这么个空壳,故称为僵尸。

之所以保留task_struct,是因为task_struct里面保存了进程的退出码、以及一些统计信息。

而其父进程很可能会关心这些信息。比如在shell中,$?变量就保存了最后一个退出的前台进程的退出码,而这个退出码往往被作为if语句的判断条件。

当然,内核也可以将这些信息保存在别的地方,而将task_struct结构释放掉,以节省一些空间。

但是使用task_struct结构更为方便,因为在内核中已经建立了从pid到task_struct查找关系,还有进程间的父子关系。

释放掉task_struct,则需要建立一些新的数据结构,以便让父进程找到它的子进程的退出信息。

子进程在退出的过程中,内核会给其父进程发送一个信号,通知父进程来“收尸”。

父进程可以通过wait系列的系统调用(如wait4、waitid)来等待某个或某些子进程的退出,并获取它的退出信息。

然后wait系列的系统调用会顺便将子进程的尸体(task_struct)也释放掉。

这个信号默认是SIGCHLD,但是在通过clone系统调用创建子进程时,可以设置这个信号。

如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态,子进程的尸体(task_struct)也就无法释放掉。

如果这时父进程结束了,那么init进程自动会接手这个子进程,为它收尸,它还是能被清除的。

但是如果如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程。

当进程退出的时候,会将它的所有子进程都托管给别的进程(使之成为别的进程的子进程)。

托管的进程可能是退出进程所在进程组的下一个进程(如果存在的话),或者是1号进程。

所以每个进程、每时每刻都有父进程存在。除非它是1号进程。1号进程,pid为1的进程,又称init进程。

Linux系统启动后,第一个被创建的用户态进程就是init进程。它有两项使命:

1、执行系统初始化脚本,创建一系列的进程(它们都是init进程的子孙);

2、在一个死循环中等待其子进程的退出事件,并调用waitid系统调用来完成“收尸”工作;

init进程不会被暂停、也不会被杀死(这是由内核来保证的)。它在等待子进程退出的过程中处于task_interruptible状态,“收尸”过程中则处于task_running状态。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7258616.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-03
下一篇 2023-04-03

发表评论

登录后才能评论

评论列表(0条)

保存