对于linux运维,我们都是使用ssh登录到服务器,如果我们运行的任务需要很长时间或不间断运行,在我们直接关闭终端窗口或网络不稳定的情况下,任务就会中断,当然这只对于普通程序,不包括如mysqld,httpd这样的守护进程。
原因分析:
- [root@DigMouse ~]# ping 51osos.com > /dev/null &
- [1] 13678
- [root@DigMouse ~]# pstree -H 13678
- init-+-NetworkManager
- |-sshd---sshd---bash-+-ping
- | `-pstree
当用户注销(logout)或者网络断开时,终端会收到 HUP(hangup)信号从而关闭其所有子进程。从上面的例子大家可以看出当前我们所处的 bash 是 sshd 的子进程,当 ssh 断开连接时,HUP 信号会影响到它下面的所有子进程,包括ping进程。
解决思路:
1.让进程运行在新的session(会话)里即不属于此终端的子进程。
2.可以实现让进程忽略HUP信号
解决方法:
1.nohup命令
功能:不挂断地运行命令,忽略HUP信号。
语法:nohup command &
实例:
- [root@DigMouse ~]# nohup ping 51osos.com > /dev/null &
- [1] 13683
- [root@DigMouse ~]# nohup: ignoring input and redirecting stderr to stdout
- [root@DigMouse ~]# ls
- Desktop Downloads nohup.out
- Documents Music Public Videos
- [root@DigMouse ~]# cat nohup.out
- PING cd447.gotoip.net (122.225.57.246) 56(84) bytes of data.
- 64 bytes from 122.225.57.246: icmp_seq=1 ttl=56 time=48.6 ms
- 64 bytes from 122.225.57.246: icmp_seq=2 ttl=56 time=47.8 ms
- 64 bytes from 122.225.57.246: icmp_seq=3 ttl=56 time=49.9 ms
- 64 bytes from 122.225.57.246: icmp_seq=4 ttl=56 time=49.5 ms
- [root@DigMouse ~]# ps -ef | grep ping
- root 13683 13655 0 09:33 pts/0 00:00:00 ping 51osos.com
- root 13687 13655 0 09:36 pts/0 00:00:00 grep ping
- [root@DigMouse ~]#
关闭此终端,打开另一个终端使用ps命令,仍然可以查看到ping进程。 无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup.out 文件中。如果当前目录的 nohup.out 文件不可写,输出重定向到 $HOME/nohup.out 文件中。
#nohup command > command.out 2>&1 &
上面的例子中nohup command输出的内容输出到了command.out文件中,错误内容输出到了标准输出。
2.setsid命令
功能:run a program in a new session在新的会话中运行程序
实例:
- [root@DigMouse ~]# setsid ping 51osos.com > /dev/null
- [root@DigMouse ~]# ps -ef | grep ping
- root 13696 1 0 09:45 ? 00:00:00 ping 51osos.com
- root 13698 13655 0 09:46 pts/0 00:00:00 grep ping
- [root@DigMouse ~]#
从上例可以看出ping进程的PID是13696,进程的父ID(PPID)是init而不是当前终端的进程 ID,可与nohup比较。
3.将"&"也放入“()”内执行命令
将一个或多个命名包含在“()”中就能让这些命令在子 shell 中运行
- [root@DigMouse ~]# (ping 51osos.com > /dev/null &)
- [root@DigMouse ~]# ps -ef | grep ping
- root 13702 1 0 09:50 pts/0 00:00:00 ping 51osos.com
- root 13704 13655 0 09:50 pts/0 00:00:00 grep ping
- [root@DigMouse ~]#
进程的父ID(PPID)是init而不是当前终端的进程 ID,因而关闭终端无任何影响。
4.disown命令
- 用disown -h jobspec 来使某个作业忽略HUP信号。
- 用disown -ah 来使所有的作业都忽略HUP信号。
- 用disown -rh 来使正在运行的作业忽略HUP信号。
- 当使用过 disown 之后,会将把目标作业从作业列表中移除,我们将不能再使用jobs来查看它,但是依然能够用ps -ef查找到它。
但是还有一个问题,这种方法的操作对象是作业,如果我们在运行命令时在结尾加了"&"来使它成为一个作业并在后台运行,那么就万事大吉了,我们可以通过jobs命令来得到所有作业的列表。但是如果并没有把当前命令作为作业来运行,如何才能得到它的作业号呢?答案就是用 CTRL-z(按住Ctrl键的同时按住z键)了!
CTRL-z 的用途就是将当前进程挂起(Suspend),然后我们就可以用jobs命令来查询它的作业号,再用bg jobspec 来将它放入后台并继续运行。需要注意的是,如果挂起会影响当前进程的运行结果,请慎用此方法。
- [root@DigMouse ~]# ping 51osos.com > /dev/null
- ^Z
- [1]+ Stopped ping 51osos.com > /dev/null
- [root@DigMouse ~]# jobs
- [1]+ Stopped ping 51osos.com > /dev/null
- [root@DigMouse ~]# bg %1
- [1]+ ping 51osos.com > /dev/null &
- [root@DigMouse ~]# jobs
- [1]+ Running ping 51osos.com > /dev/null &
- [root@DigMouse ~]# disown -h %1
- [root@DigMouse ~]# ps -ef | grep ping
- root 13716 13655 0 09:59 pts/0 00:00:00 ping 51osos.com
- root 13734 13655 0 10:01 pts/0 00:00:00 grep ping
-
此时jobs还是能看到ping后台任务的。logout后在另一个终端测试
- [root@DigMouse ~]# ps -ef | grep ping
- root 13716 1 0 09:59 ? 00:00:00 ping 51osos.com
- root 13754 13738 0 10:02 pts/1 00:00:00 grep ping
- 此时Jobs无ping后台任务。PPID变成了1
5.screen命令
此命令非常强大。如果非常多的命令都需要忽略HUP命令,screen可以解决这一问题。screen 提供了 ANSI/VT100 的终端模拟器,使它能够在一个真实终端下运行多个全屏的伪终端。
- 用screen -dmS session name 来建立一个处于断开模式下的会话(并指定其会话名)。
- 用screen -list 来列出所有会话。
- 用screen -r session name 来重新连接指定会话。
- 用快捷键CTRL-a d 来暂时断开当前会话。
- 我的CentOS6.0上没有screen命令,不过可以使用yum安装。
- [root@DigMouse ~]# yum list screen
- Available Packages
- screen.i686 4.0.3-15.el6 base
- [root@DigMouse ~]# yum install screen*
- [root@DigMouse ~]# screen -r DigMouse
- [root@DigMouse ~]# ping 51osos.com > /dev/null &
- [1] 13789
- [root@DigMouse ~]# pstree -H 13789