用于进程管理和作业控制的主要命令如下图所示。

Linux基础--进程管理和作业控制_Linux


大部分命令都是对进程运行状态进行查询和监控的,而工作中与进程相关的也基本就是监控进程运行状态,检查影响系统运行瓶颈在哪里,然后进行调忧工作。因此本文只着重介绍常用的进程监控命令的监控信息所代表的含义,至于命令怎么使用可以参照man手册或其他文档。如:[12个进程管理命令介绍]


1.ps - report a snapshot of the current processes.

ps有三个不同风格的用法,GNU的长选项风格就不提了,比较难记。还是说说比较常用的两个经典组合吧。一个是BSD风格的ps aux,一个是unix风格的ps -efF。

Linux基础--进程管理和作业控制_作业_02

USER:启动此进程的用户

PID:进程号

%CPU:CPU占用率

%MEM:内存占用率

VSZ:虚拟内存集

RSS:常驻内存集

vsz         VSZ     virtual memory size of the process in KiB (1024-byte units). Device
                    mappings are currently excluded; this is subject to change.
                    (alias vsize).
rss         RSS     resident set size, the non-swapped physical memory that a task has
                    used (in kiloBytes). (alias rssize, rsz).

TTY:启动此进程的终端,'?'表示系统后台启动的进程。

STAT:进程运行状态

PROCESS STATE CODES
       Here are the different values that the s, stat and state output specifiers
       (header "STAT" or "S") will display to describe the state of a process.
       D    Uninterruptible sleep (usually IO)
       R    Running or runnable (on run queue)
       S    Interruptible sleep (waiting for an event to complete)
       T    Stopped, either by a job control signal or because it is being traced.
       W    paging (not valid since the 2.6.xx kernel)
       X    dead (should never be seen)
       Z    Defunct ("zombie") process, terminated but not reaped by its parent.
       For BSD formats and when the stat keyword is used, additional characters may be
       displayed:
       <    high-priority (not nice to other users)
       N    low-priority (nice to other users)
       L    has pages locked into memory (for real-time and custom IO)
       s    is a session leader
       l    is multi-threaded (using CLONE_THREAD, like NPTL pthreads do)
       +    is in the foreground process group

START:进程启动时间/日期

TIME:在CPU上执行的累计时长

COMMAND:启动此进程的命令,'[]'表示内核启动的线程。


Linux基础--进程管理和作业控制_作业_03

PPID:父进程号

C:CPU占用率

SZ:进程实际占用物理内存大小,包含文本、数据和栈空间。

PSR: 进程当前运行在CPU的哪个核心上

C           pcpu      cpu utilization
sz          SZ        size in physical pages of the core p_w_picpath of the process.  This
                      includes text, data, and stack space.  Device mappings are currently
                      excluded; this is subject to change.  See vsz and rss.
psr         PSR       processor that process is currently assigned to.


2. top - display Linux processes

Linux基础--进程管理和作业控制_作业_04

比较难懂点的就是load average和%CPU那两行了。我觉得man手册写的挺好,直接贴了。

system load avg over the last 1, 5 and 15 minutes

Line 2 shows CPU state percentages based on the interval since the last refresh.

As a default, percentages for these individual categories are displayed.  Where two labels
are shown below, those for more recent kernel versions are shown first.
   us, user    : time running un-niced user processes
   sy, system  : time running kernel processes
   ni, nice    : time running niced user processes
   id, idle    : time spent in the kernel idle handler
   wa, IO-wait : time waiting for I/O completion
   hi : time spent servicing hardware interrupts
   si : time spent servicing software interrupts
   st : time stolen from this vm by the hypervisor


下面的字段含义:

VIRT:虚拟内存集

RES:常驻内存集

SHR:共享内存集

S: 进程运行状态

20. S  --  Process Status
   The status of the task which can be one of:
       D = uninterruptible sleep
       R = running
       S = sleeping
       T = stopped by job control signal
       t = stopped by debugger during trace
       Z = zombie

重点说下PR和NI

PR:进程优先级。1-99:实时优先级,数字越大优先级越高,系统自动安排;100-139:静态优先级,数字越小优先级越高,可手动更改。说明:rt为real time,实时优先级;20实际为100+20,显示为20而已.

NI:Nice Value。-20至19,对应于优先级100到139。因此可以通过renice命令来调整nice值进而改变进程优先级,或者使用nice命令指定进程启动的nice值,不指定时使用默认nice值0。普通用户只能通过调整nice值降低进程优先级,而root则可以随意调整。


3. htop - interactive process viewer

Linux基础--进程管理和作业控制_进程_05

htop是由epel源提供的软件包,需要额外安装。界面美观很多,甚至可以使用鼠标交互。字段信息跟top是一致的,不另外介绍了,你值得拥有。


4. dstat - versatile tool for generating system resource statistics

Linux基础--进程管理和作业控制_作业_06

可以自定义参数的,默认使用了-cdngy。

-c, --cpu
      enable cpu stats (system, user, idle, wait, hardware interrupt, software interrupt
-d, --disk
      enable disk stats (read, write)
-n, --net
      enable network stats (receive, send)
-g, --page
      enable page stats (page in, page out)
-y, --sys
      enable system stats (interrupts, context switches)

选项含义和字段含义都解释的很清楚吧,所以最好不过man手册。


5. kill/killall/pkill

kill实际上是给进程发送信号量的,并不一定是杀死进程,也可以是让进程reload或者从挂起状态转为继续运行状态的。

Linux基础--进程管理和作业控制_进程_07

以上是所有可用的信号量,而常用的一般是以下几个:

1)SIGHUP:无须关闭进程而让其重读配置文件。
2)SIGINT:终止正在运行的进程,相当于Ctrl+C,中断。
9)SIGKILL:杀死运行中的进程。
15)SIGTERM:终止运行中的进程;通常终止为后台进程。默认信号量
18)SIGCONT:继续,让后台停止状态进程在后台继续运行。
19)SIGSTOP:停止,将进程送后台,停止状态。

使用时,可以给信号量编号,也可以给信号量全称或者是简称,不指定信号量,使用默认信号量。


killall和pkill也是同样的原理。


6. 作业控制

系统作业分为前台作业和后台作业。

  • 前台作业(foregroud):通过终端启动,且启动后会一直占据终端。

  • 后台作业(backgroud):可以通过终端启动,但启动后即转入后台运行(释放终端)。


让作业运行于后台

  • 对于运行中作业使用Ctrl+Z组合键,将作业送往后台,转为停止状态。相当于发送了SIGSTOP信号量。

  • 对于尚未启动的作业使用在命令后加上'&'来启动,像这样。

    [root@localhost ~]# COMMAND &

    但这样启动的作业仍然与终端相关,如果希望将其与终端剥离,可以这样。

    [root@localhost ~]# nohup COMMAND &


使用jobs命令可以有哪些作业在后台运行或者被挂起。

[root@localhost ~]# jobs
[1]-  Stopped                 top
[2]   Running                 nohup dstat &
[3]+  Stopped                 ping 172.18.0.1


控制后台作业

[root@localhost ~]# fg  [[%]JOB_NUM]:把指定的作业调回前台;
[root@localhost ~]# bg  [[%]JOB_NUM]:让送往后台的作业在后台继续运行;
[root@localhost ~]# kill %JOB_NUM:终止指定的作业;

fg和bg的%可以省,kill的%是不能省的,省了就成了发送信号量了。fg和bg省略JOB_NUM时,默认是指带+号的那个作业。