Linux下的多进程编程初步(转载)
1 引言
对于没有接触过Unix/Linux操作系统的人来说 ,fork是最难理解的概念之一 :它执行一次却返回两个值。
fork函数是Unix系统最杰出的成就之一 ,它是七十年代UNIX早期的开发者经过长期在理论和实践上的艰苦探索
后取得的成果 ,一方面 ,它使操作系统在进程管理上付出了最小的代价 ,另一方面 ,又为程序员提供了一个简
洁明了的多进程方法。与DOS和早期的Windows不同,Unix/Linux系统是真正实现多任务操作的系统 ,可以
说 ,不使用多进程编程 ,就不能算是真正的Linux环境下编程。
多线程程序设计的概念早在六十年代就被提出,但直到八十年代中期 ,Unix系统中才引入多线程机制 ,
如今 ,由于自身的许多优点 ,多线程编程已经得到了广泛的应用。
下面 ,我们将介绍在Linux下编写多进程和多线程程序的一些初步知识。
2 多进程编程
什么是一个进程?进程这个概念是针对系统而不是针对用户的 ,对用户来说 ,他面对的概念是程序。当
用户敲入命令执行一个程序的时候 ,对系统而言 ,它将启动一个进程。但和程序不同的是 ,在这个进程中,系
统可能需要再启动一个或多个进程来完成独立的多个任务。多进程编程的主要内容包括进程控制和进程间通
信 ,在了解这些之前 ,我们先要简单知道进程的结构。
2.1 Linux下进程的结构
Linux下一个进程在内存里有三部分的数据 ,就是"代码段"、"堆栈段"和"数据段"。其实学过汇编语言的人
一定知道 ,一般的CPU都有上述三种段寄存器 ,以方便操作系统的运行。这三个部分也是构成一个完整的执行
序列的必要的部分。
"代码段" ,顾名思义 ,就是存放了程序代码的数据 ,假如机器中有数个进程运行相同的一个程序 ,那么它
们就可以使用相同的代码段。"堆栈段"存放的就是子程序的返回地址、子程序的参数以及程序的局部变量。而
数据段则存放程序的全局变量 ,常数以及动态数据分配的数据空间(比如用malloc之类的函数取得的空间)。
这其中有许多细节问题 ,这里限于篇幅就不多介绍了。系统如果同时运行数个相同的程序 ,它们之间就不能使
用同一个堆栈段和数据段。
2.2 Linux下的进程控制
在传统的Unix环境下 ,有两个基本的操作用于创建和修改进程 :函数fork( )用来创建一个新的进程 ,该进
程几乎是当前进程的一个完全拷贝;函数族exec( )用来启动另外的进程以取代当前运行的进程。Linux的进程
控制和传统的Unix进程控制基本一致 ,只在一些细节的地方有些区别 ,例如在Linux系统中调用vfork和fork完
全相同,而在有些版本的Unix系统中,vfork调用有不同的功能。由于这些差别几乎不影响我们大多数的编程 ,
在这里我们不予考虑。
2.2.1 fork( )
fork在英文中是"分叉"的意思。为什么取这个名字呢?因为一个进程在运行中,如果使用了fork ,就产生
了另一个进程 ,于是进程就"分叉"了,所以这个名字取得很形象。下面就看看如何具体使用fork ,这段程序演
示了使用fork的基本框架 :
[cpp]
01. void main(){
02. int i;
03. if ( fork() 0 ) {
04. /* 子进程程序 */
05. for ( i 1; i <1000; i ++ ) printf("This is child process/n");
06. }
07. else {
08. /* 父进程程序*/
09. for ( i 1; i <1000; i ++ ) printf("This is process process/n");
10. }
11. }
程序运行后 ,你就能看到屏幕上交替出现子进程与父进程各打印出的一千条信息了。如果程序还在运行
中,你用ps命令就能看到系统中有两个它在运行了。
那么调用这个fork函数时发生了什么呢?fork函数启动一个新的进程 ,前面我们说过 ,这个进程几乎是当
前进程的一个拷贝 :子进程和父进程使用相同的代码段 ;子进程复制父进程的堆栈段和数据段。这样 ,父进程
的所有数据都可以留给子进程 ,但是 ,子进程一旦开始运行 ,虽然它继承了父进程的一切数据 ,但实际上数据
却已经分开 ,相互之间不再有影响了,也就是说 ,它们之间不再共