今天继续学习文件与io,主要是学习文件共享及文件、复制文件描述符,有点抽象,主要是概念上的理解,但是很重要,下面一一来分解:

文件共享:

回顾一下,在linux系统调用中,是通过文件描述符来访问文件的,文件描述符是一个非负的整数,这是站在用户的观点来看的,实际上在linux内核上是有一定的数据结构来表示文件描述符的,下面就从三方面来看图分析一下内核中是怎么来表示打开的文件的:

一个进程打开两个文件内核数据结构:

linux系统编程之文件与io(四)_#include


linux系统编程之文件与io(四)_#include_02

 

所以,由于文件描述符0、1、2被占用了,则我们用户打开的文件描述符只能从第3开始了:

linux系统编程之文件与io(四)_#include_03

如图上所示,对于内核,当打开一个文件时,会有一张表格来记录文件的状态,回顾一下,当我们在读取文件内容的时候,会自动的从当前文件的偏移位置去读取下一个数据,在文件的随机读写中已经介绍过 ,原因就在于这个偏移量就保存在文件表当中的:

linux系统编程之文件与io(四)_#include_04


而每当我们打开一个文件时,内核就会为文件分配一个文件表,里面有不同的项,其中当前文件偏移量就是一个文件表项

回忆一下,我们打开一个文件,可以以读、写、追加、同步、非阻塞(这个之后会学到)等方式打开,用来描述它的就是另一个文件表项:文件状态标志

linux系统编程之文件与io(四)_描述符_05


另外图中还有一个文件引用计数,它是用来描述一个文件被多少个文件描述符指向了(这个在下面的复制文件描述符中就可以体会到了):

linux系统编程之文件与io(四)_描述符_06


另外,还有一个文件表项,它是v节点指针,它指向了v节点表,如图所示:

linux系统编程之文件与io(四)_#include_07

其中v节点表中,存放了两项很重要的信息,一个是v节点信息,一个是i节点信息:

v节点信息:我们上节学习的stat函数获得文件信息返回的状态信息就全保存在v节点信息里

linux系统编程之文件与io(四)_描述符_08

i节点信息:当我们打开一个文件时,会将文件系统当中的i结点数据拷贝到v节点表中的i节点信息所存放的位置,比如说:

linux系统编程之文件与io(四)_文件描述符_09


一个进程两次打开同一个文件内核数据结构:

linux系统编程之文件与io(四)_#include_10


下面以具体代码来进行说明:


#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>


#define ERR_EXIT(m) \
do \
{ \
perror(m); \
exit(EXIT_FAILURE); \
} while(0)

int main(int argc, char *argv[])
{
int fd1;
int fd2;
char buf1[1024] = {0};
char buf2[1024] = {0};
fd1 = open("test.txt", O_RDONLY);//以只读的方式打开文件
if (fd1 == -1)
ERR_EXIT("open error");
read(fd1, buf1, 5);
printf("buf1=%s\n", buf1);


fd2 = open("test.txt", O_RDWR);//以读写的方式打开文件
if (fd2 == -1)
ERR_EXIT("open error");

read(fd2, buf2, 5);
printf("buf2=%s\n", buf2);

close(fd1);
close(fd2);
return 0;
}


先新建一个test.txt,里面输点测试内容:

linux系统编程之文件与io(四)_描述符_11

编译运行:

linux系统编程之文件与io(四)_描述符_12

也就是各个描述符有各自的偏移量,当buf1输出ABCDE时,如果第二个描述符共享偏移量的话,应该buf2输出FGhel,但是buf2输出的也是ABCDE,也就说明了各个文件描述符有不同的文件表项。


#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>


#define ERR_EXIT(m) \
do \
{ \
perror(m); \
exit(EXIT_FAILURE); \
} while(0)

int main(int argc, char *argv[])
{
int fd1;
int fd2;
char buf1[1024] = {0};
char buf2[1024] = {0};
fd1 = open("test.txt", O_RDONLY);
if (fd1 == -1)
ERR_EXIT("open error");
read(fd1, buf1, 5);
printf("buf1=%s\n", buf1);


fd2 = open("test.txt", O_RDWR);
if (fd2 == -1)
ERR_EXIT("open error");

read(fd2, buf2, 5);
printf("buf2=%s\n", buf2);
write(fd2, "AAAAA", 5);

memset(buf1, 0, sizeof(buf1));
read(fd1, buf1, 5);
printf("buf1=%s\n", buf1);
close(fd1);
close(fd2);
return 0;
}


编译运行:

linux系统编程之文件与io(四)_文件描述符_13

这结果为什么是它呢?下面来分析下:

write(fd2, "AAAAA", 5);

这时我们先来查看下test.txt的内容:

linux系统编程之文件与io(四)_文件描述符_14

由于它会改变v节点表中的i节点信息所指向磁盘中的数据,而两个文件描述符的v节点表是共享的,而fd1此时的偏移量为5:

linux系统编程之文件与io(四)_文件描述符_15


总结:每打开一个文件描述符,就有一个对应的文件表项描述,而如果打开的是同一个文件,v节点表是共享的 


两个进程打开同一个文件内核数据结构:

linux系统编程之文件与io(四)_文件描述符_16

说明:不同的进程可以打开同一个文件,但是每个进程的文件描述符对应一个独立的文件表项,而最终共享v节点表。

总结:文件描述符跟文件不是一一对应的,文件描述符可以有多个,但是文件可以只有一个。


理解了打开的文件在内核中的结构,进而我们就可以理解复制文件描述符是怎么一回事了,如下:

复制文件描述符:

先用图来进行说明:

linux系统编程之文件与io(四)_文件描述符_17


其中复制文件描述符,可以执行dup命令,注意,这时它会从0开始找出有空闲的文件描述符,如图,0、1、2是已经默认被系统给占用了,这时,执行dup之后,就会找到空闲的fd 4文件描述符,将它也指向同一个文件表,如图:

linux系统编程之文件与io(四)_描述符_18

下面,以一段程序来说明一下输出重定向的原理,先复习一下什么是输出重定向:

linux系统编程之文件与io(四)_#include_19

下面,以具体程序来说明它,利用的就是复制文件描述符的知识:

linux系统编程之文件与io(四)_文件描述符_20

先本地建一个空的test2.txt文件:

linux系统编程之文件与io(四)_#include_21

分析一下这个程序:

close(1)的作用,就是为了让输出到屏幕的文件描述符成为空闲的,然后dup时,会从0开始找空闲文件描述符,发现1是空闲的,则这时它的内存模型就变成这样了:

linux系统编程之文件与io(四)_文件描述符_22

所以,清楚了它之后,对于ls > aa这样的输出重定向的功能,就比较容易实现了。

另外,对于复制文件描述符有三种方法:

linux系统编程之文件与io(四)_#include_23

对于dup2,理解它,我们可以将上面复制文件描述符的程序用dup2代替dup,如下:

linux系统编程之文件与io(四)_描述符_24

编译运行:

linux系统编程之文件与io(四)_文件描述符_25


另外第三种复制文件描述符的方法,是通过fcntl函数,它稍复杂一些,这个会在下节详细进行分析,先看一下man帮助:

linux系统编程之文件与io(四)_文件描述符_26

其中第三个参数,可以决定复制文件描述符时,从第几个描述符开始搜索空闲,利用dup实现复制文件描述符时都是从0开始搜索的。

好了,关于fcntl的使用,下节再见!