进程是通过文件描述符(file descriptor,fd)来访问文件的,每个进程最多能同时使用NR_OPEN个文件描述符,这个值在include/linux/limits.h中定义为1024。每一个进程用一个打开文件表files_struct来描述进程的文件描述符使用情况。每一个文件都有一个文件指针。
进程的task_struct中有文件系统相关的数据成员:
struct task_struct { …… /* filesystem information */ struct fs_struct *fs; /* open file information */ struct files_struct *files; …… };
结构fs_struct给出了与进程相关的文件系统的信息,比如进程自己的当前工作目录,它的根目录等,这个结构的定义为:
---------------------------------------------------------------------
include/linux/fs_struct.h struct fs_struct { int users; rwlock_t lock; /* 用于表中字段的读/写自旋锁 */ int umask; /* 当打开文件设置文件权限时所使用的位掩码 */ int in_exec; struct path root, pwd; };
---------------------------------------------------------------------
其中path结构的root和pwd两个成员分别描述了进程最常用到的两个目录的信息,即根目录和当前目录,path结构定义如下:
---------------------------------------------------------------------
include/linux/path.h struct path { struct vfsmount *mnt; struct dentry *dentry; };
---------------------------------------------------------------------
mnt:描述目录所安装的文件系统对象
dentry:描述目录的目录项
还有一个表表示进程打开的文件,即task_struct结构的files_struct类型的files字段。它给出了所有的进程描述符的使用情况,其file结构指针数组成员给出了文件描述符的信息,其定义如下:
---------------------------------------------------------------------
include/linux/fdtable.h struct files_struct { /* * read mostly part */ atomic_t count; /* 共享该表的进程数目 */ /* 文件描述符表 */ struct fdtable *fdt; struct fdtable fdtab; /* * written part on a separate cache line in SMP */ /* 用于表中字段的读/写自旋锁 */ spinlock_t file_lock ____cacheline_aligned_in_smp; int next_fd; /* 所分配的最大文件描述符加1 */ /* 执行exec() 时需要关闭的文件描述符的集合 */ struct embedded_fd_set close_on_exec_init; /* 文件描述符的初始集合 */ struct embedded_fd_set open_fds_init; /* 文件对象指针的初始化数组 */ struct file * fd_array[NR_OPEN_DEFAULT]; };
---------------------------------------------------------------------
在新的管理文件描述符的无锁模型中,锁机制是基于RCU的。文件描述表包含多个成员——fd sets(open_fds 和 close_on_exec, 文件指针数组, 文件描述符集和文件指针数组的大小)。为了使更新在一个无锁的读者看来是原子的,则文件描述符表的所有元素被放在一个单独的结构——struct fdtable中。
即,fdtable结构是进程的文件描述符表,其定义如下:
---------------------------------------------------------------------
include/linux/fdtable.h struct fdtable { unsigned int max_fds; struct file ** fd; /* current fd array */ fd_set *close_on_exec; fd_set *open_fds; struct rcu_head rcu; struct fdtable *next; };
---------------------------------------------------------------------
fd字段指向文件对象指针数组。该数组的长度存放在max_fds中。通常,fd字段指向files_struct的fd_array字段,该字段包含32个文件对象指针。如果进程打开的文件数目多于32个,内核就分配一个新的、更大的文件指针数组,并将其地址放在fd中,内核也同时更新max_fds字段的值。
对于在fd数组中有元素的每个文件来说,数组的索引就是文件描述符。Unix进程将文件描述符作为主文件标识符。两个文件描述符可以指向同一个打开的文件。
进程不能使用多于NR_OPEN个文件描述符。open_fds字段最初包含open_fds_init字段的地址,open_fds_init表示当前已打开文件描述符的位图。max_fds字段存放位图中的位数。
fd_set结构是文件描述符集,它将同一种情况下的多个文件描述符放在一起。在include/linux/types.h有中定义:
typedef __kernel_fd_set fd_set;
__kernel_fd_set结构在include/linux/posix_types.h中定义:
typedef struct {
unsigned long fds_bits [__FDSET_LONGS];
} __kernel_fd_set;
其中与__FDSET_LONGS有关的一些宏:
#define __NFDBITS (8 * sizeof(unsigned long)) #undef __FD_SETSIZE #define __FD_SETSIZE 1024 #undef __FDSET_LONGS #define __FDSET_LONGS (__FD_SETSIZE/__NFDBITS)
embedded_fd_set结构是小的文件描述符集,它将同一情况下的文件描述符放在一起,只能存放unsigned long类型位数个文件描述符,不过,这对于许多进程已经足够了。
/* * The embedded_fd_set is a small fd_set, * suitable for most tasks (which open <= BITS_PER_LONG files) */ struct embedded_fd_set { unsigned long fds_bits[1]; };