用于进程管理和作业控制的主要命令如下图所示。
大部分命令都是对进程运行状态进行查询和监控的,而工作中与进程相关的也基本就是监控进程运行状态,检查影响系统运行瓶颈在哪里,然后进行调忧工作。因此本文只着重介绍常用的进程监控命令的监控信息所代表的含义,至于命令怎么使用可以参照man手册或其他文档。如:[12个进程管理命令介绍]
1.ps - report a snapshot of the current processes.
ps有三个不同风格的用法,GNU的长选项风格就不提了,比较难记。还是说说比较常用的两个经典组合吧。一个是BSD风格的ps aux,一个是unix风格的ps -efF。
USER:启动此进程的用户
PID:进程号
%CPU:CPU占用率
%MEM:内存占用率
VSZ:虚拟内存集
RSS:常驻内存集
vsz VSZ virtual memory size of the process in KiB (1024-byte units). Device mappings are currently excluded; this is subject to change. (alias vsize). rss RSS resident set size, the non-swapped physical memory that a task has used (in kiloBytes). (alias rssize, rsz).
TTY:启动此进程的终端,'?'表示系统后台启动的进程。
STAT:进程运行状态
PROCESS STATE CODES Here are the different values that the s, stat and state output specifiers (header "STAT" or "S") will display to describe the state of a process. D Uninterruptible sleep (usually IO) R Running or runnable (on run queue) S Interruptible sleep (waiting for an event to complete) T Stopped, either by a job control signal or because it is being traced. W paging (not valid since the 2.6.xx kernel) X dead (should never be seen) Z Defunct ("zombie") process, terminated but not reaped by its parent. For BSD formats and when the stat keyword is used, additional characters may be displayed: < high-priority (not nice to other users) N low-priority (nice to other users) L has pages locked into memory (for real-time and custom IO) s is a session leader l is multi-threaded (using CLONE_THREAD, like NPTL pthreads do) + is in the foreground process group
START:进程启动时间/日期
TIME:在CPU上执行的累计时长
COMMAND:启动此进程的命令,'[]'表示内核启动的线程。
PPID:父进程号
C:CPU占用率
SZ:进程实际占用物理内存大小,包含文本、数据和栈空间。
PSR: 进程当前运行在CPU的哪个核心上
C pcpu cpu utilization sz SZ size in physical pages of the core p_w_picpath of the process. This includes text, data, and stack space. Device mappings are currently excluded; this is subject to change. See vsz and rss. psr PSR processor that process is currently assigned to.
2. top - display Linux processes
比较难懂点的就是load average和%CPU那两行了。我觉得man手册写的挺好,直接贴了。
system load avg over the last 1, 5 and 15 minutes Line 2 shows CPU state percentages based on the interval since the last refresh. As a default, percentages for these individual categories are displayed. Where two labels are shown below, those for more recent kernel versions are shown first. us, user : time running un-niced user processes sy, system : time running kernel processes ni, nice : time running niced user processes id, idle : time spent in the kernel idle handler wa, IO-wait : time waiting for I/O completion hi : time spent servicing hardware interrupts si : time spent servicing software interrupts st : time stolen from this vm by the hypervisor
下面的字段含义:
VIRT:虚拟内存集
RES:常驻内存集
SHR:共享内存集
S: 进程运行状态
20. S -- Process Status The status of the task which can be one of: D = uninterruptible sleep R = running S = sleeping T = stopped by job control signal t = stopped by debugger during trace Z = zombie
重点说下PR和NI
PR:进程优先级。1-99:实时优先级,数字越大优先级越高,系统自动安排;100-139:静态优先级,数字越小优先级越高,可手动更改。说明:rt为real time,实时优先级;20实际为100+20,显示为20而已.
NI:Nice Value。-20至19,对应于优先级100到139。因此可以通过renice命令来调整nice值进而改变进程优先级,或者使用nice命令指定进程启动的nice值,不指定时使用默认nice值0。普通用户只能通过调整nice值降低进程优先级,而root则可以随意调整。
3. htop - interactive process viewer
htop是由epel源提供的软件包,需要额外安装。界面美观很多,甚至可以使用鼠标交互。字段信息跟top是一致的,不另外介绍了,你值得拥有。
4. dstat - versatile tool for generating system resource statistics
可以自定义参数的,默认使用了-cdngy。
-c, --cpu enable cpu stats (system, user, idle, wait, hardware interrupt, software interrupt -d, --disk enable disk stats (read, write) -n, --net enable network stats (receive, send) -g, --page enable page stats (page in, page out) -y, --sys enable system stats (interrupts, context switches)
选项含义和字段含义都解释的很清楚吧,所以最好不过man手册。
5. kill/killall/pkill
kill实际上是给进程发送信号量的,并不一定是杀死进程,也可以是让进程reload或者从挂起状态转为继续运行状态的。
以上是所有可用的信号量,而常用的一般是以下几个:
1)SIGHUP:无须关闭进程而让其重读配置文件。 2)SIGINT:终止正在运行的进程,相当于Ctrl+C,中断。 9)SIGKILL:杀死运行中的进程。 15)SIGTERM:终止运行中的进程;通常终止为后台进程。默认信号量 18)SIGCONT:继续,让后台停止状态进程在后台继续运行。 19)SIGSTOP:停止,将进程送后台,停止状态。
使用时,可以给信号量编号,也可以给信号量全称或者是简称,不指定信号量,使用默认信号量。
killall和pkill也是同样的原理。
6. 作业控制
系统作业分为前台作业和后台作业。
前台作业(foregroud):通过终端启动,且启动后会一直占据终端。
后台作业(backgroud):可以通过终端启动,但启动后即转入后台运行(释放终端)。
让作业运行于后台
对于运行中作业使用Ctrl+Z组合键,将作业送往后台,转为停止状态。相当于发送了SIGSTOP信号量。
对于尚未启动的作业使用在命令后加上'&'来启动,像这样。
[root@localhost ~]# COMMAND &
但这样启动的作业仍然与终端相关,如果希望将其与终端剥离,可以这样。
[root@localhost ~]# nohup COMMAND &
使用jobs命令可以有哪些作业在后台运行或者被挂起。
[root@localhost ~]# jobs [1]- Stopped top [2] Running nohup dstat & [3]+ Stopped ping 172.18.0.1
控制后台作业
[root@localhost ~]# fg [[%]JOB_NUM]:把指定的作业调回前台; [root@localhost ~]# bg [[%]JOB_NUM]:让送往后台的作业在后台继续运行; [root@localhost ~]# kill %JOB_NUM:终止指定的作业;
fg和bg的%可以省,kill的%是不能省的,省了就成了发送信号量了。fg和bg省略JOB_NUM时,默认是指带+号的那个作业。