在Linux中,如果要让进程在后台运行,一般情况下,我们在命令后面加上&即可,实际上,这样是将命令放入到一个作业队列中了:


Example

$ .         /test         .sh &        
         [1] 17208        
                  
         $ jobs -l        
         [1]+ 17208 Running                 .         /test         .sh &



对于已经在前台执行的命令,也可以重新放到后台执行,首先按ctrl+z暂停已经运行的进程,然后使用bg命令将停止的作业放到后台运行:


Example

$ .         /test         .sh        
         [1]+  Stopped                 .         /test         .sh        
                  
         $          bg          %1        
         [1]+ .         /test         .sh &        
                  
         $ jobs -l        
         [1]+ 22794 Running                 .         /test         .sh &




但是如上方到后台执行的进程,其父进程还是当前终端shell的进程,而一旦父进程退出,则会发送hangup信号给所有子进程,子进程收到hangup以后也会退出。如果我们要在退出shell的时候继续运行进程,则需要使用nohup忽略hangup信号,或者setsid将将父进程设为init进程(进程号为1)


Example

$          echo          $$        
         21734        
                  
         $          nohup          .         /test         .sh &        
         [1] 29016        
                  
         $          ps          -ef |          grep          test        
         515      29710 21734  0 11:47 pts         /12            00:00:00          /bin/sh          .         /test         .sh        
         515      29713 21734  0 11:47 pts         /12            00:00:00          grep          test



Example

$ setsid .         /test         .sh &        
         [1] 409        
                  
         $          ps          -ef |          grep          test        
         515        410     1  0 11:49 ?        00:00:00          /bin/sh          .         /test         .sh        
         515        413 21734  0 11:49 pts         /12            00:00:00          grep          test



上面的试验演示了使用nohup/setsid加上&使进程在后台运行,同时不受当前shell退出的影响。那么对于已经在后台运行的进程,该怎么办呢?可以使用disown命令:


Example

$ .         /test         .sh &        
         [1] 2539        
                  
         $ jobs -l        
         [1]+  2539 Running                 .         /test         .sh &        
                  
         $ disown -h %1        
                  
         $          ps          -ef |          grep          test        
         515        410     1  0 11:49 ?        00:00:00          /bin/sh          .         /test         .sh        
         515       2542 21734  0 11:52 pts         /12            00:00:00          grep          test



另外还有一种方法,即使将进程在一个subshell中执行,其实这和setsid异曲同工。方法很简单,将命令用括号() 括起来即可:


Example

$ (.         /test         .sh &)        
                  
         $          ps          -ef |          grep          test        
         515        410     1  0 11:49 ?        00:00:00          /bin/sh          .         /test         .sh        
         515      12483 21734  0 11:59 pts         /12            00:00:00          grep          test



注:本文试验环境为Red Hat Enterprise Linux AS release 4 (Nahant Update 5),shell为/bin/bash,不同的OS和shell可能命令有些不一样。例如AIX的ksh,没有disown,但是可以使用nohup -p PID来获得disown同样的效果。

还有一种更加强大的方式是使用screen,首先创建一个断开模式的虚拟终端,然后用-r选项重新连接这个虚拟终端,在其中执行的任何命令,都能达到nohup的效果,这在有多个命令需要在后台连续执行的时候比较方便:


Example

$          screen          -dmS screen_test        
                  
         $          screen          -list        
         There is a          screen          on:        
                  27963.screen_test       (Detached)        
         1 Socket          in          /tmp/uscreens/S-jiangfeng         .        
                  
         $          screen          -r screen_test




//


现在说说我的问题和解决方法:


我想在Ubuntu服务器上挂载一个socket通信的小程序,是一个server,我想让这个程序一直运行着。可是我发现一旦没有客户端来连接它,没几分钟,改程序自动关闭。这是个令人头疼的问题。


根据上面指导,解决方法如下:


输入指令:


echo $$

nohup ./tcp_demo &

ps -ef |grep tcp_demo


//


nohup、setsid、&和disown


在执行命令时,偶尔会碰到需要让对应进程无间断执行的情况。前段时间看到IBM官网的一篇文章,由于不让转载(原文位置: IBM),遂简单记录如下:

我们知道,当用户注销(logout)或者网络断开时,终端会收到 HUP(hangup)信号从而关闭其所有子进程。因此,我们的解决办法就有两种途径:要么让进程忽略 HUP 信号,要么让进程运行在新的会话里从而成为不属于此终端的子进程。

1. nohup
显而易见,nohup命令的功能是使进程忽略hangup信号,从而持续执行。nohup 的使用是十分方便的,只需在要处理的命令前加上 nohup 即可,标准输出和标准错误缺省会被重定向到 nohup.out 文件中。一般我们可在结尾加上"&"来将命令同时放入后台运行,也可用">filename 2>&1"来更改缺省的重定向文件名。
如:nohup myUbuntuSourceSyncCmd.pl >./sources/ubuntu/sync.log 2>&1 &
这样起到了三个效果:进程后台执行;忽略hangup信号;输出重定向。

2. setsid
setsid中的sid指的是session id,意指以该命令运行的进程是一个新的session,因此其父进程id不属于当前终端。实际上,setsid运行的进程,其父进程id(PPID)为1(init 进程的 PID)。因此,setsid解决问题用的是第二种途径。
如:setsid myUbuntuSourceSyncCmd.pl >./sources/ubuntu/sync.log 2>&1 &
格式与nohup相仿,后台运行也需加上&,但输出重定向必须手动设置。

3. 括号()与&
&代表后台运行(注意输出并没有被重定向);此外,我们知道,将一个或多个命名包含在“()”中就能让这些命令在子 shell 中运行中,从而扩展出很多有趣的功能,我们现在要讨论的就是其中之一。
当我们将"&"也放入“()”内之后,我们就会发现所提交的作业并不在作业列表中,也就是说,是无法通过jobs来查看的。
如:(myUbuntuSourceSyncCmd.pl >./sources/ubuntu/sync.log 2>&1 &)
以这种方式运行程序,新提交的进程的父 ID为1,并不是当前终端的进程 ID。因此并不属于当前终端的子进程,从而也就不会受到当前终端的 HUP 信号的影响了。

4. disown
如果我们未加任何处理就已经提交了命令,这时想加 nohup 或者 setsid 已经为时已晚,只能通过作业调度和 disown 来解决这个问题了。让我们来看一下 disown 的帮助信息:
disown [-ar] [-h] [jobspec ...]
Without options, each jobspec is  removed  from  the  table  of
active  jobs.   If  the -h option is given, each jobspec is not
removed from the table, but is marked so  that  SIGHUP  is  not
sent  to the job if the shell receives a SIGHUP.  If no jobspec
is present, and neither the -a nor the -r option  is  supplied,
the  current  job  is  used.  If no jobspec is supplied, the -a
option means to remove or mark all jobs; the -r option  without
a  jobspec  argument  restricts operation to running jobs.  The
return value is 0 unless a jobspec does  not  specify  a  valid
job.
可以看出,我们可以用如下方式来达成我们的目的。
a. 用disown -h jobspec 来使某个作业忽略HUP信号。
b. 用disown -ah 来使所有的作业都忽略HUP信号。
c. 用disown -rh 来使正在运行的作业忽略HUP信号。
需要注意的是,当使用过 disown 之后,会将把目标作业从作业列表中移除,我们将不能再使用jobs来查看它,但是依然能够用ps -ef查找到它。
但是还有一个问题,这种方法的操作对象是作业,如果我们在运行命令时在结尾加了"&"来使它成为一个作业并在后台运行,那么就万事大吉了,我们可以通过jobs命令来得到所有作业的列表。但是如果并没有把当前命令作为作业来运行,如何才能得到它的作业号呢?答案就是用 CTRL-z(按住Ctrl键的同时按住z键)了!
CTRL-z 的用途就是将当前进程挂起(Suspend),然后我们就可以用jobs命令来查询它的作业号,再用bg jobspec 来将它放入后台并继续运行。需要注意的是,如果挂起会影响当前进程的运行结果,慎用此方法。
示例:

root@ubuntu-server:/mnt/ftp# jobs 
 
 [1]+  Running                 ./sync_mirror.sh & 
 
 root@ubuntu-server:/mnt/ftp# disown -h %1 
 
 root@ubuntu-server:/mnt/ftp# ps -ef|grep sync_mirror.sh  
 
 root      8650 22271  0 15:08 pts/0    00:00:00 grep sync_mirror.sh 
 
 root     16748 22271  0 Mar31 pts/0    00:00:00 /bin/sh -e ./sync_mirror.sh



另外还有一个命令screen。screen 提供了 ANSI/VT100 的终端模拟器,使它能够在一个真实终端下运行多个全屏的伪终端。screen 的参数很多,具有很强大的功能。本篇不做介绍。