这里后三种方法
- 在/etc/inittab文件加一条语句( :id:rstate:action:process),运行动作为 respawn,这样在每次系统检测到process进程不存在时,就会重启它。
- 创建一个守护进程,该守护进程的功能就是检测主进程是否在运行,若不在运行,那么守护进程就启动它。(这里存在一个问题,守护进程也可能会被杀死,那么更狠的一点就是监测守护进程和主进程互相监测,任意一个进程被干死都启动对方)。
- 写一个脚本到craontab里,隔一段时间检测进程是否存在。
首先了解下inittab文件
inittab文件中每一记录都从新的一行开始,每个记录项最多可有512个字符,每一项的格式通常如下:id:rstate:action:process,下面分别解释。
1.id字段是最多4个字符的字符串,用来唯一标志表项。
2.rstate(run state)字段定义该记录项被调用时的运行级别,rstate可以由一个或多个运行级别构成,也可以是空,空则代表运行级别0~6。当请求init改变 运行级别时,那些rstate字段中不包括新运行级别的进程将收到SIGTERM警告信号,并且最后被杀死;只有a、b、c启动的命令外(a、b、c不是 真正的运行级别)
3.action字段告诉init执行的动作,即如何处理process字段指定的进程,action字段允许的值及对应的动作分别为:
1)respawn:如果process字段指定的进程不存在,则启动该进程,init不等待处理结束,而是继续扫描inittab文件中的后续进程,当这样的进程终止时,init会重新启动它,如果这样的进程已存在,则什么也不做。
2)wait:启动process字段指定的进程,并等到处理结束才去处理inittab中的下一记录项。
3)once:启动process字段指定的进程,不等待处理结束就去处理下一记录项。当这样的进程终止时,也不再重新启动它,在进入新的运行级别时,如果这样的进程仍在运行,init也不重新启动它。
4)boot:只有在系统启动时,init才处理这样的记录项,启动相应进程,并不等待处理结束就去处理下一个记录项。当这样的进程终止时,系统也不重启它。
5)bootwait:系统启动后,当第一次从单用户模式进入多用户模式时处理这样的记录项,init启动这样的进程,并且等待它的处理结束,然后再进行下一个记录项的处理,当这样的进程终止时,系统也不重启它。
6)powerfail:当init接到断电的信号(SIGPWR)时,处理指定的进程。
7)powerwait:当init接到断电的信号(SIGPWR)时,处理指定的进程,并且等到处理结束才去检查其他的记录项。
8)off:如果指定的进程正在运行,init就给它发SIGTERM警告信号,在向它发出信号SIGKILL强制其结束之前等待5秒,如果这样的进程不存在,则忽略这一项。
9)ondemand:功能通respawn,不同的是,与具体的运行级别无关,只用于rstate字段是a、b、c的那些记录项。
10)sysinit:指定的进程在访问控制台之前执行,这样的记录项仅用于对某些设备的初始化,目的是为了使init在这样的设备上向用户提问有关运行级别的问题,init需要等待进程运行结束后才继续。
0123456,于是进入级别6,这样便陷入了一个循环,如果 inittab文件中没有包含initdefault的记录项,则在系统启动时请求用户为它指定一个初始运行级别
4.Process字段中进程可以是任意的守候进程、可执行脚本或程序。
另外:在任何时候,可以在文件inittab中添加新的记录项,级别Q/q不改变当前的运行级别,重新检查inittab文件,可以通过命令init Q或init q使init进程立即重新读取并处理文件inittab
以上这些都是介绍的标准的linux System V的标准,所以对嵌入式来讲有些东西并不见得有用!这里介绍点针对嵌入式的,也就是针对busybox init的:
busybox的init
除了基本的命令之外,BusyBox还支持init功能,如同其它的init一样,busybox的init也是完成系统的初始化工作,关机前的工作等 等,我们知道在Linux的内核被载入之后,机器就把控制权转交给内核,linux的内核启动之后,做了一些工作,然后找到根文件系统里面的init程 序,并执行它,BusyBox的init进程会依次进行以下工作:(参考<<构建嵌入式LINUX系统>> p201)
1. 为init设置信号处理过程
2. 初始化控制台
3. 剖析/etc/inittab文件
4. 执行系统初始化命令行,缺省情况下会使用/etc/init.d/rcS
5. 执行所有导致init暂停的inittab命令(动作类型:wait)
6. 执行所有仅执行一次的inittab(动作类型:once)
一旦完成以上工作,init进程便会循环执行以下进程:
1. 执行所有终止时必须重新启动的inittab命令(动作类型:once)
2. 执行所有终止时必须重新启动但启动前必须询问用户的inittab命令(动作类型:askfirst)
初始化控制台之后,BusyBox会检查/etc/inittab文件是否存在,如果此文件不存在,BusyBox会使用缺省的inittab配置,它主 要为系统重引导,系统挂起以及init重启动设置缺省的动作,此外它还会为四个虚拟控制台(tty1到tty4)设置启动shell的动作。如果未建立这 些设备文件,BusyBox会报错。
inittab文件中每一行的格式如下所示:(busybox的根目录下的example文件夹下有详尽的inittab文件范例)
id:runlevel:action:process
尽 管此格式与传统的Sytem V init类似,但是,id在BusyBox的init中具有不同的意义。对BusyBox而言,id用来指定启动进程的控制tty。如果所启动的进程并不 是可以交互的shell,例如BusyBox的sh(ash),应该会有个控制tty,如果控制tty不存在,Busybox的sh会报错。 BusyBox将会完全忽略runlevel字段,所以空着它就行了,你也许会问既然没用保留着它干吗,我想大概是为了和传统的Sytem V init保持一致的格式吧。process字段用来指定所执行程式的路径,包括命令行选项。action字段用来指定下面表中8个可应用到process 的动作之一。
动作
结果
sysinit
为init提供初始化命令行的路径
respawn
每当相应的进程终止执行便会重新启动
askfirst
类似respawn,不过它的主要用途是减少系统上执行的终端应用程序的数量。它将会促使init在控制台上显示“Please press Enter to active this console”的信息,并在重新启动之前等待用户按下enter键
wait
告诉init必须等到相应的进程完成之后才能继续执行
once
仅执行相应的进程一次,而且不会等待它完成
ctratldel
当按下Ctrl+Alt+Delete组合键时,执行相应的进程
shutdown
当系统关机时,执行相应的进程
restart
当init重新启动时,执行相应的进程,通常此处所执行的进程就是init本身
以下是我的usblinux的inittab文件
::sysinit:/etc/init.d/rcS
::respawn:/sbin/getty 115200 tty1
tty2::askfirst:-/bin/sh
tty3::askfirst:-/bin/sh
::restart:/sbin/init
::ctrlaltdel:/bin/umount -a -r
这个inittab执行下列动作
1. 将/etc/init.d/rcS设置成系统的初始化文件
2. 在115200 bps的虚拟终端tty1上启动一个登陆会话 (注意getty的用法)
3. 在虚拟终端tty2和tty3上启动askfirst动作的shell
4. 如果init重新启动,将/sbin/init设置成它会执行的程序
5. 告诉init,在系统关机的时候执行umount命令卸载所有文件系统,并且在卸载失败时用只读模式冲新安装以保护文件系统。
1、busybox的inittab与pc使用的inittab不同,第一ID并不是随便取名字的,这个名字要与/dev/目录下是否有对应的文件对应
对应错误
can't open /dev/0: No such file or directory
process '-/bin/sh' (pid 789) exited. Scheduling for restart.
can't open /dev/0: No such file or directory
process '-/bin/sh' (pid 793) exited. Scheduling for restart.
2、出现下面这种错误:
process '-/bin/sh' (pid 789) exited. Scheduling for restart.
process '-/bin/sh' (pid 794) exited. Scheduling for restart.
process '-/bin/sh' (pid 796) exited. Scheduling for restart.
process '-/bin/sh' (pid 798) exited. Scheduling for restart.
对应的inittab文件中有
ttyS0::askfirst:-/bin/sh
虽然在/dev/目录下有ttyS0设备,但是这个设备显然不可用,所以才会出现上面的错误
3、当在inittab中同时定义的两个在同一个串口终端登陆的语句时
::askfirst:-/bin/sh
s3c2410_serial0:23456:respawn:/sbin/getty -L s3c2410_serial0 115200 vt100
出现的情况就是被抢占,不能接收任何串口输入
4、bad inittab entry
多半时因为非法字符造成的。
5、busybox中的字段runleve也没有运行时的运行级别的概念
6、分析一下启动的过程
1. 为init设置信号处理过程
2. 初始化控制台
3. 剖析/etc/inittab文件
4. 执行系统初始化命令行,缺省情况下会使用/etc/init.d/rcS
5. 执行所有导致init暂停的inittab命令(动作类型:wait)
6. 执行所有仅执行一次的inittab(动作类型:once)
一旦完成以上工作,init进程便会循环执行以下进程:
1. 执行所有终止时必须重新启动的inittab命令(动作类型:once)
2. 执行所有终止时必须重新启动但启动前必须询问用户的inittab命令(动作类型:askfirst)
初始化控制台之后,BusyBox会检查/etc/inittab文件是否存在,如果此文件不存在,BusyBox会使用缺省的inittab配置,它主 要为系统重引导,系统挂起以及init重启动设置缺省的动作,此外它还会为四个虚拟控制台(tty1到tty4)设置启动shell的动作。如果未建立这 些设备文件,BusyBox会报错。
在了解一下守护进程
守护进程(Daemon Process),也就是通常说的 Daemon 进程(精灵进程),是 Linux 中的后台服务进程。它是一个生存期较长的进程,通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。
守护进程是个特殊的孤儿进程,这种进程脱离终端,为什么要脱离终端呢?之所以脱离于终端是为了避免进程被任何终端所产生的信息所打断,其在执行过程中的信息也不在任何终端上显示。由于在 Linux 中,每一个系统与用户进行交流的界面称为终端,每一个从此终端开始运行的进程都会依附于这个终端,这个终端就称为这些进程的控制终端,当控制终端被关闭时,相应的进程都会自动关闭。
Linux 的大多数服务器就是用守护进程实现的。比如,Internet 服务器 inetd,Web 服务器 httpd 等。
在终端敲:ps axj
a 表示不仅列当前用户的进程,也列出所有其他用户的进程
x 表示不仅列有控制终端的进程,也列出所有无控制终端的进程
j 表示列出与作业控制相关的信息
从上图可以看出守护进行的一些特点:
- 守护进程基本上都是以超级用户启动( UID 为 0 )
- 没有控制终端( TTY 为 ?)
- 终端进程组 ID 为 -1 ( TPGID 表示终端进程组 ID)
一般情况下,守护进程可以通过以下方式启动:
- 在系统启动时由启动脚本启动,这些启动脚本通常放在 /etc/rc.d 目录下;
- 利用 inetd 超级服务器启动,如 telnet 等;
- 由 cron 定时启动以及在终端用 nohup 启动的进程也是守护进程。
如何编写守护进程?
下面是编写守护进程的基本过程:
1)屏蔽一些控制终端操作的信号
这是为了防止守护进行在没有运行起来前,控制终端受到干扰退出或挂起。关于信号的更详细用法,请看《信号中断处理》。
[cpp] view plaincopy
1. signal(SIGTTOU,SIG_IGN);
2. signal(SIGTTIN,SIG_IGN);
3. signal(SIGTSTP,SIG_IGN);
4. signal(SIGHUP ,SIG_IGN);
2)在后台运行
这是为避免挂起控制终端将守护进程放入后台执行。方法是在进程中调用 fork() 使父进程终止, 让守护进行在子进程中后台执行。
[cpp] view plaincopy
1. if( pid = fork() ){ // 父进程
2. //结束父进程,子进程继续
3. }
3)脱离控制终端、登录会话和进程组
有必要先介绍一下 Linux 中的进程与控制终端,登录会话和进程组之间的关系:进程属于一个进程组,进程组号(GID)就是进程组长的进程号(PID)。登录会话可以包含多个进程组。这些进程组共享一个控制终端。这个控制终端通常是创建进程的 shell 登录终端。 控制终端、登录会话和进程组通常是从父进程继承下来的。我们的目的就是要摆脱它们 ,使之不受它们的影响。因此需要调用 setsid() 使子进程成为新的会话组长,示例代码如下:
[cpp] view plaincopy
- setsid();
setsid() 调用成功后,进程成为新的会话组长和新的进程组长,并与原来的登录会话和进程组脱离。由于会话过程对控制终端的独占性,进程同时与控制终端脱离。
4)禁止进程重新打开控制终端
现在,进程已经成为无终端的会话组长,但它可以重新申请打开一个控制终端。可以通过使进程不再成为会话组长来禁止进程重新打开控制终端,采用的方法是再次创建一个子进程,示例代码如下:
[cpp] view plaincopy
1. if( pid=fork() ){ // 父进程
2. // 结束第一子进程,第二子进程继续(第二子进程不再是会话组长)
3. }
5)关闭打开的文件描述符
进程从创建它的父进程那里继承了打开的文件描述符。如不关闭,将会浪费系统资源,造成进程所在的文件系统无法卸下以及引起无法预料的错误。按如下方法关闭它们:
[cpp] view plaincopy
1. // NOFILE 为 <sys/param.h> 的宏定义
2. // NOFILE 为文件描述符最大个数,不同系统有不同限制
3. for(i=0; i< NOFILE; ++i){// 关闭打开的文件描述符
4. close(i);
5. }
6)改变当前工作目录
进程活动时,其工作目录所在的文件系统不能卸下。一般需要将工作目录改变到根目录。对于需要转储核心,写运行日志的进程将工作目录改变到特定目录如 /tmp。示例代码如下:
[cpp] view plaincopy
1. chdir("/");
7)重设文件创建掩模
进程从创建它的父进程那里继承了文件创建掩模。它可能修改守护进程所创建的文件的存取权限。为防止这一点,将文件创建掩模清除:
[cpp] view plaincopy
- umask(0);
8)处理 SIGCHLD 信号
但对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结束,子进程将成为僵尸进程(zombie)从而占用系统资源(关于僵尸进程的更多详情,请看《僵尸进程》)。如果父进程等待子进程结束,将增加父进程的负担,影响服务器进程的并发性能。在 Linux 下可以简单地将 SIGCHLD 信号的操作设为 SIG_IGN 。关于信号的更详细用法,请看《信号中断处理》。
[cpp] view plaincopy
- signal(SIGCHLD, SIG_IGN);
这样,内核在子进程结束时不会产生僵尸进程。
示例代码如下:
1. #include <unistd.h>
2. #include <signal.h>
3. #include <fcntl.h>
4. #include <sys/syslog.h>
5. #include <sys/param.h>
6. #include <sys/types.h>
7. #include <sys/stat.h>
8. #include <stdio.h>
9. #include <stdlib.h>
10. #include <time.h>
11.
12. int init_daemon(void)
13. {
14. int pid;
15. int i;
16.
17. // 1)屏蔽一些控制终端操作的信号
18. signal(SIGTTOU,SIG_IGN);
19. signal(SIGTTIN,SIG_IGN);
20. signal(SIGTSTP,SIG_IGN);
21. signal(SIGHUP ,SIG_IGN);
22.
23. // 2)在后台运行
24. if( pid=fork() ){ // 父进程
25. //结束父进程,子进程继续
26. else if(pid< 0){ // 出错
27. "fork");
28. exit(EXIT_FAILURE);
29. }
30.
31. // 3)脱离控制终端、登录会话和进程组
32. setsid();
33.
34. // 4)禁止进程重新打开控制终端
35. if( pid=fork() ){ // 父进程
36. // 结束第一子进程,第二子进程继续(第二子进程不再是会话组长)
37. else if(pid< 0){ // 出错
38. "fork");
39. exit(EXIT_FAILURE);
40. }
41.
42. // 5)关闭打开的文件描述符
43. // NOFILE 为 <sys/param.h> 的宏定义
44. // NOFILE 为文件描述符最大个数,不同系统有不同限制
45. for(i=0; i< NOFILE; ++i){
46. close(i);
47. }
48.
49. // 6)改变当前工作目录
50. "/tmp");
51.
52. // 7)重设文件创建掩模
53. umask(0);
54.
55. // 8)处理 SIGCHLD 信号
56. signal(SIGCHLD,SIG_IGN);
57.
58. return 0;
59. }
60.
61. int main(int argc, char *argv[])
62. {
63. init_daemon();
64.
65. while(1);
66.
67. return 0;
68. }
运行结果如下: