linux系统编程之进程(二)

原创

webor2006 2014-01-05 13:24:00 ©著作权

文章标签 #include 子进程父进程 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者webor2006的原创作品，请联系作者获取转载授权，否则将追究法律责任

今天继续学习进程相关的东东，上节提到了，当fork()之后，子进程复制了父进程当中的大部分数据，其中对于打开的文件，如果父进程打开了，子进程则不需要打开了，是共享的，所以首先先来研究下共享文件这一块的东东：

fork之后父子进程共享文件:

首先先通过其原理图来了解一下什么是父子进程共享文件：

父进程打开两个文件：

linux系统编程之进程(二)_子进程

这时通过fork()函数新建了一个子进程，这时它共享父进程的文件，其结构如下：

linux系统编程之进程(二)_#include_02

【说明：对于上图不是很清楚的，

通过上面的图对父子进程的文件共享有个大概的认识之后，下面以具体代码来进行阐述,接着上节的代码进行实现：

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>


#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int main(int argc, char *argv[])
{
    signal(SIGCHLD, SIG_IGN);
    printf("before fork pid = %d\n", getpid());
    int fd;
    fd = open("test.txt", O_WRONLY);//父进程打开一个文件
    if (fd == -1)
        ERR_EXIT("open error");


    pid_t pid;
    pid = fork();
    if (pid == -1)
        ERR_EXIT("fork error");

    if (pid > 0)
    {
        printf("this is parent pid=%d childpid=%d\n", getpid(), pid);
        write(fd, "parent", 6);//父进程往文件中写入内容
        sleep(1);//睡眠是为了避免孤儿进程的产生，保证子进程执行的时候，父进程没有退出
    }
    else if (pid == 0)
    {
        printf("this is child pid=%d parentpid=%d\n", getpid(), getppid());
        write(fd, "child", 5);//子进程往文件中写入内容
    }
    return 0;
}

先创建一个"test.txt"，里面是空内容:

linux系统编程之进程(二)_#include_03

也就是可以说明，子进程是共享父进程打开的文件表项的。

注意：有时候可能会test.txt的内容输出如下:

linux系统编程之进程(二)_父进程_04

上面这种输出并没有按照我们的预想，可能的原因是跟两个进程的静态问题造成的，这个问题比较复杂，可以这样理解：也就是还没等子进程执行，父进程就已经结束了，这时子进程的文件偏移量会从0开始，所以之前父进程写入了parent，由于它退出来，子进程从0的位置开始写，所以最终输出就如上图所示了，为了保证如我们预期来输出，可以将睡眠时间加长上些，保证子进程执行时，父进程没有退出，如下:

linux系统编程之进程(二)_子进程_05

fork【几乎都用它】与vfork【几乎很少用它】:

上节中我们知道，fork的拷贝机制是copy on write，图中所说的exec函数，是指加载一个新的程序来执行，这个下面会有介绍到，先大概了解下，如果说没有copy on write机制的话，那父子进程都有自己独立的进程空间，也就是子进程需要完完全全的拷贝父进程的地址空间，而如果子进程中执行exec的话，等于它被一个新的程序替换掉了，它根本不需要拷贝父进程的数据，所以就会造成地址空间的浪费，这时才引入了vfork，也就是vfork之后子进程在执行exec之前，是不会拷贝父进程的地址空间的，不管子进程有没有改写数据，它是一个历史问题(说得有点抽象，下面会以具体代码来一一阐述的)。下面就以代码来说明这两者的区别：

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>


#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int gval = 100;

int main(int argc, char *argv[])
{
    signal(SIGCHLD, SIG_IGN);
    printf("before fork pid = %d\n", getpid());

    pid_t pid;
    pid = fork();//这里是用的copy on write机制
    if (pid == -1)
        ERR_EXIT("fork error");

    if (pid > 0)
    {
        sleep(1);//它的目的是为了让子进程先对gval进行++操作，以便观察父进程是否会受影响
        printf("this is parent pid=%d childpid=%d gval=%d\n", getpid(), pid, gval);
        sleep(3);
    }
    else if (pid == 0)
    {
        gval++;//子进程来改写数据
        printf("this is child pid=%d parentpid=%d gval=%d\n", getpid(), getppid(), gval);
    }
    return 0;
}

编译运行：

linux系统编程之进程(二)_#include_07

其原因也就是由于fork()是采用copy on write的机制，下面用图来解析一下上面的结果：

linux系统编程之进程(二)_子进程_08

下面将其改为vfork来实现:

linux系统编程之进程(二)_父进程_09

编译运行：

linux系统编程之进程(二)_父进程_10

这个输出结果，可以表明，vfork产生子进程，当改写数据时也不会拷贝父进程的空间的，父子是共享一份空间，所以当子进程改写的数据会反映到父进程上。

另外这段程序中出现了一个“段错误”,这是因为：

linux系统编程之进程(二)_父进程_11

linux系统编程之进程(二)_#include_12

这时，编译再运行，就不会有错误了：

linux系统编程之进程(二)_父进程_13

另外执行exec函数也一样，关于它的使用，之后再来介绍。

linux系统编程之进程(二)_父进程_14

提示：vfork是一个历史问题，了解一下既可，实际中很少用它！

在演示vfork时，提到“子进程必须立刻执行_exit”，那如果用exit(0)退呢？

linux系统编程之进程(二)_子进程_15

编译运行：

linux系统编程之进程(二)_子进程_16

我们通常会将return 0 与exit(0)划等号，但如果在vfork()中，还是划等号么？

linux系统编程之进程(二)_父进程_17

编译运行：

linux系统编程之进程(二)_子进程_18

那exit与_exit有啥区别呢？下面来探讨下，在探讨之前，先来回顾一下进程的五种终止方式：

linux系统编程之进程(二)_#include_19

下面以一个图来说明exit与_exit的区别：

linux系统编程之进程(二)_#include_20

区别一：exit是C库中的一个函数；而_exit是系统调用。

区别二：exit在调用内核之前，做了“调用终止处理程序、清除I/O缓冲”;而_exit是直接操作内核，不会做这两件事。

下面就以具体代码来说明两者的区别：

linux系统编程之进程(二)_子进程_21

编译运行：

linux系统编程之进程(二)_#include_22

exit(0)相当于return 0;所以可想将上面return 0换为exit(0)也是一样的能在屏幕上打印出来，那如果换成_exit(0)呢？

linux系统编程之进程(二)_子进程_23

这时编译运行：

linux系统编程之进程(二)_#include_24

linux系统编程之进程(二)_#include_25

这时就正常显示了：

linux系统编程之进程(二)_子进程_26

另外对于exit来说，它会调用“终止处理程序”,所谓“终止处理程序”，就是指在程序结束的时候会调用的函数代码段，这些代码段，需要我们安装才可以，可以用如下函数：

linux系统编程之进程(二)_#include_27

其中传递的参数是函数指针。

下面用具体代码来进行说明：

linux系统编程之进程(二)_父进程_28

编译运行：

linux系统编程之进程(二)_#include_29

如果换成是_exit()呢？

linux系统编程之进程(二)_#include_30

编译运行：

linux系统编程之进程(二)_父进程_31

插一句：对于fork函数，有一个问题需进一步阐述一下，以便加深对它的理解：

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>


#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int main(int argc, char *argv[])
{
    signal(SIGCHLD, SIG_IGN);
    printf("before fork pid = %d\n", getpid());

    pid_t pid;
    pid = fork();
    if (pid == -1)
        ERR_EXIT("fork error");

    if (pid > 0)
    {
        printf("this is parent pid=%d childpid=%d\n", getpid(), pid);
        sleep(3);
    }
    else if (pid == 0)
    {
        printf("this is child pid=%d parentpid=%d\n", getpid(), getppid());
    }
    return 0;
}

输出：

linux系统编程之进程(二)_父进程_32

对于上面这段程序，就是上节中学习过的，但是有个问题值得思考一下，为啥fork()之后，不是从"before fork"从main的第一行起输出，而是从fork()之后的代码中去输出，这时因为fork()之后，拷贝了“代码段+数据段+堆栈段+PCB”，也就是两个进程的信息几乎都是一样，而由于堆栈段+PCB几乎是一样的，所以它会维护当前运行的信息，所以每个进程会从fork()之后的代码继续执行，这一点需要理解。

另外，再看一个跟fork()相关的程序:

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>

#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int main(int argc, char *argv[])
{
    fork();
    fork();
    fork();
    printf("ok\n");
    return 0;
}

这段程序会打印多少行呢？

编译运行：

linux系统编程之进程(二)_#include_33

这是为什么呢？因为第一个fork()时，会产生两个进程，这时这两个进程都会执行它后面的代码，也就是第二个fork()，这时就有四个进程执行第二个fork()了，同样的，这时四个进程就会执行它下面的代码，也就是第三个fork()，这时就再产生四个进程，总共也就是八个进程了，这个比较不好理解，好好想一下！

最后，我们来说明一下execve函数，这个在上面介绍vfork()函数时，已经提到过了，它的作用是:替换进程映像，这时对它进行使用说明：

linux系统编程之进程(二)_子进程_34

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>

#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int gval = 100;

int main(int argc, char *argv[])
{
    signal(SIGCHLD, SIG_IGN);
    printf("before fork pid = %d\n", getpid());

    pid_t pid;
    pid = vfork();
    if (pid == -1)
        ERR_EXIT("fork error");

    if (pid > 0)
    {
        printf("this is parent pid=%d childpid=%d gval=%d\n", getpid(), pid, gval);
    }
    else if (pid == 0)
    {
        char *const args[] = {"ps", NULL};

        execve("/bin/ps", args, NULL);//将子进程完全替换成/bin/ps中的ps进程命令，所以这句话之后的代码就不会执行了，因为是完全被替换了
        gval++;
        printf("this is child pid=%d parentpid=%d gval=%d\n", getpid(), getppid(), gval);
    }
    return 0;
}