top命令大家应该都不陌生,liunx 下的一个性能分析工具,能够实时显示系统中各个进程的资源占用状况。
最简单的使用方式:
终端输入 top
见下图,能看到一些指标,初学者只会看 cpu 和内存,这次我们来详细的学习介绍一下这些指标及使用方法
top - 17:10:06 up 381 days, 7:28, 3 users, load average: 0.06, 0.09, 0.20
Tasks: 202 total, 1 running, 200 sleeping, 0 stopped, 1 zombie
%Cpu(s): 13.1 us, 3.5 sy, 0.0 ni, 82.2 id, 0.0 wa, 0.0 hi, 1.3 si, 0.0 st
KiB Mem : 8008396 total, 1287348 free, 1352076 used, 5368972 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 6273356 avail Mem
性能指标
前面的1-5行显示的是当前机器的一些运行状况,系统整体的统计信息。
下面分析对这些指标进行说明记录。
在使用的时候我们只需要重点关注三个指标:
- 第2行的 Tasks的 total,看看进程数有没有暴增,比如我们正常使用就是一百多个进程,突然一下上到2百3百就要关注和分析了。
- 第3行的 Cpu 的 us 指票,用户占用 cpu 百分比
- 第4行的内存 used,使用的内存总量
第1行:任务队列信息
top - 17:02:59 up 381 days, 7:20, 3 users, load average: 0.07, 0.20, 0.28
- 当前时间:17:10:06
- 系统运行时间 + 格式: up 381 days, 7:28,表示机器已经不间断运行了381天7小时28分
- 当前登录用户数: 3 users
- 系统负载,任务队列的平均时长3个值分别为1、5、15分钟:load average: 0.06, 0.09, 0.20
第2行:进程信息
Tasks: 176 total, 1 running, 174 sleeping, 0 stopped, 1 zombie
- 进程总数:total,Tasks: 176 total,表示当前有176个进程(经常 CPU 暴增的最大元凶,进程开太多 CPU 吃不消)
- 正在运行的进程数:running
- 睡眠的进程数:sleeping
- 停止的进程数:stopped
- 僵尸进程数:zombie
第3行:CPU 信息
%Cpu(s): 13.1 us, 3.5 sy, 0.0 ni, 82.2 id, 0.0 wa, 0.0 hi, 1.3 si, 0.0 st
- us 用户空间占用百分比: 13.1us
- sy 内核空间占用百分比: 3.5sy
- ni 用户进程空间内改变过优先级的进程占用cpu 百分比,有点绕(基本上不用管)
- id 空闲CPU百分比: 82.2
- wa 等待输入输出的 CPU 时间百分比: 0.0 wa
- hi 硬件 CPU 中断占用百分比:0.0(这个很少有变化)
- si 软中断占用百分比 1.3
- st 虚拟机占用百分比 0.0
第4行:内存信息
KiB Mem : 8008396 total, 1287348 free, 1352076 used, 5368972 buff/cache
- total 物理内存总量: 8008396:8G的内存
- used 使用的物理内存总量:1352076,使用了1个多 G
- free 空闲内存总量:1287348空闲1个多 G
- buff/cache 内枋缓存的内存量:5368972 buff/cache,5个多G
第5行: swap交换区信息
KiB Swap: 0 total, 0 free, 0 used. 6273356 avail Mem
- total 交换区总量
- free 空闲交换区总量
- used 已经使用的交换区总量
- avail Men 可以测量可以分配和使用的内存量,而不会导致更多的交换。
进程信息
进程详细信息说明
默认情况下仅显示比较重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。
列名 | 说明 |
PID | 进程id |
PPID | 父进程id |
RUSER | Real user name |
UID | 进程所有者的用户id |
USER | 进程所有者的用户名 |
GROUP | 进程所有者的组名 |
TTY | 启动进程的终端名。不是从终端启动的进程则显示为 ? |
PR | 优先级 |
NI | nice值。负值表示高优先级,正值表示低优先级 |
P | 最后使用的CPU,仅在多CPU环境下有意义 |
%CPU | 上次更新到现在的CPU时间占用百分比 |
TIME | 进程使用的CPU时间总计,单位秒 |
TIME+ | 进程使用的CPU时间总计,单位1/100秒 |
%MEM | 进程使用的物理内存百分比 |
VIRT | 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES |
SWAP | 进程使用的虚拟内存中,被换出的大小,单位kb。 |
RES | 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA |
CODE | 可执行代码占用的物理内存大小,单位kb |
DATA | 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb |
SHR | 共享内存大小,单位kb |
nFLT | 页面错误次数 |
nDRT | 最后一次写入到现在,被修改过的页面数。 |
S | 进程状态(D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程) |
COMMAND | 命令名/命令行 |
WCHAN | 若该进程在睡眠,则显示睡眠中的系统函数名 |
Flags | 任务标志,参考 sched.h |
可以通过下面的快捷键来更改显示内容
更改显示内容通过 f 键可以选择显示的内容。按 f 键之后会显示列的列表,按 a-z 即可显示或隐藏对应的列,最后按回车键确定。
按 o 键可以改变列的显示顺序。按小写的 a-z 可以将相应的列向右移动,而大写的 A-Z 可以将相应的列向左移动。最后按回车键确定。
按大写的 F 或 O 键,然后按 a-z 可以将进程按照相应的列进行排序。而大写的 R 键可以将当前的排序倒转。
命令的使用
使用格式
终端直接输入 top 回车
top [-] [d] [p] [q] [c] [C] [S] [s] [n]
参数说明:
- d 指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。
- p 通过指定监控进程ID来仅仅监控某个进程的状态。
- q 该选项将使top没有任何延迟的进行刷新。如果调用程序有超级用户权限,那么top将以尽可能高的优先级运行。
- S 指定累计模式
- s 使top命令在安全模式中运行。这将去除交互命令所带来的潜在危险。
- i 使top不显示任何闲置或者僵死进程。
- c 显示整个命令行而不只是显示命令名
其它命令
Ctrl+L 擦除并且重写屏幕。
h或者? 显示帮助画面,给出一些简短的命令总结说明。
k 终止一个进程。系统将提示用户输入需要终止的进程PID,以及需要发送给该进程什么样的信号。一般的终止进程可以使用15信号;如果不能正常结束那就使用信号9强制结束该进程。默认值是信号15。在安全模式中此命令被屏蔽。
i 忽略闲置和僵死进程。这是一个开关式命令。
q 退出程序。
r 重新安排一个进程的优先级别。系统提示用户输入需要改变的进程PID以及需要设置的进程优先级值。输入一个正值将使优先级降低,反之则可以使该进程拥有更高的优先权。默认值是10。
S 切换到累计模式。
s 改变两次刷新之间的延迟时间。系统将提示用户输入新的时间,单位为s。如果有小数,就换算成m s。输入0值则系统将不断刷新,默认值是5 s。需要注意的是如果设置太小的时间,很可能会引起不断刷新,从而根本来不及看清显示的情况,而且系统负载也会大大增加。
f或者F 从当前显示中添加或者删除项目。
o或者O 改变显示项目的顺序。
l 切换显示平均负载和启动时间信息。
m 切换显示内存信息。
t 切换显示进程和CPU状态信息。
c 切换显示命令名称和完整命令行。
M 根据驻留内存大小进行排序。
P 根据CPU使用百分比大小进行排序。
T 根据时间/累计时间进行排序。
W 将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。
常用操作&实用命令
实际使用中最实用的是使用 c 和 i,过滤一堆闲置或者僵死进程,并查看实际的脚本命令。
top //每隔5秒显式所有进程的资源占用情况
top -d 2 //每隔2秒显式所有进程的资源占用情况
top -c //每隔5秒显式进程的资源占用情况,并显示进程的命令行参数(默认只有进程名)
top -p 12345 -p 6789//每隔5秒显示pid是12345和pid是6789的两个进程的资源占用情况
top -d 2 -c -p 123456 //每隔2秒显示pid是12345的进程的资源使用情况,并显式该进程启动的命令行参数