进程是通过文件描述符(file descriptor,fd)来访问文件的,每个进程最多能同时使用NR_OPEN个文件描述符,这个值在include/linux/limits.h中定义为1024。每一个进程用一个打开文件表files_struct来描述进程的文件描述符使用情况。每一个文件都有一个文件指针。

进程的task_struct中有文件系统相关的数据成员:

struct task_struct {

……

/* filesystem information */

      struct fs_struct *fs;

/* open file information */

      struct files_struct *files;

……

};

结构fs_struct给出了与进程相关的文件系统的信息,比如进程自己的当前工作目录,它的根目录等,这个结构的定义为:

---------------------------------------------------------------------
include/linux/fs_struct.h
struct fs_struct {

    int users;

    rwlock_t lock; /* 用于表中字段的读/写自旋锁 */

    int umask; /* 当打开文件设置文件权限时所使用的位掩码 */

    int in_exec;

    struct path root, pwd;

};
---------------------------------------------------------------------

其中path结构的root和pwd两个成员分别描述了进程最常用到的两个目录的信息,即根目录和当前目录,path结构定义如下:

---------------------------------------------------------------------
include/linux/path.h
struct path {

    struct vfsmount *mnt;

    struct dentry *dentry;

};
---------------------------------------------------------------------

 

mnt:描述目录所安装的文件系统对象

dentry:描述目录的目录项

 

 

还有一个表表示进程打开的文件,即task_struct结构的files_struct类型的files字段。它给出了所有的进程描述符的使用情况,其file结构指针数组成员给出了文件描述符的信息,其定义如下:

---------------------------------------------------------------------
include/linux/fdtable.h
struct files_struct {

  /*

   * read mostly part

   */

    atomic_t count; /* 共享该表的进程数目 */

    /* 文件描述符表 */

    struct fdtable *fdt;

    struct fdtable fdtab;

  /*

   * written part on a separate cache line in SMP

   */

    /* 用于表中字段的读/写自旋锁 */

    spinlock_t file_lock ____cacheline_aligned_in_smp;

    int next_fd; /* 所分配的最大文件描述符加1 */

    /* 执行exec() 时需要关闭的文件描述符的集合 */

    struct embedded_fd_set close_on_exec_init;

    /* 文件描述符的初始集合 */

    struct embedded_fd_set open_fds_init;

    /* 文件对象指针的初始化数组 */

    struct file * fd_array[NR_OPEN_DEFAULT];

};
---------------------------------------------------------------------

 

在新的管理文件描述符的无锁模型中,锁机制是基于RCU的。文件描述表包含多个成员——fd sets(open_fds 和 close_on_exec, 文件指针数组, 文件描述符集和文件指针数组的大小)。为了使更新在一个无锁的读者看来是原子的,则文件描述符表的所有元素被放在一个单独的结构——struct fdtable中。

即,fdtable结构是进程的文件描述符表,其定义如下:

---------------------------------------------------------------------
include/linux/fdtable.h
struct fdtable {

    unsigned int max_fds;

    struct file ** fd;      /* current fd array */

    fd_set *close_on_exec;

    fd_set *open_fds;

    struct rcu_head rcu;

    struct fdtable *next;

};
---------------------------------------------------------------------

 

fd字段指向文件对象指针数组。该数组的长度存放在max_fds中。通常,fd字段指向files_struct的fd_array字段,该字段包含32个文件对象指针。如果进程打开的文件数目多于32个,内核就分配一个新的、更大的文件指针数组,并将其地址放在fd中,内核也同时更新max_fds字段的值。

 

对于在fd数组中有元素的每个文件来说,数组的索引就是文件描述符。Unix进程将文件描述符作为主文件标识符。两个文件描述符可以指向同一个打开的文件。

 

进程不能使用多于NR_OPEN个文件描述符。open_fds字段最初包含open_fds_init字段的地址,open_fds_init表示当前已打开文件描述符的位图。max_fds字段存放位图中的位数。

 

fd_set结构是文件描述符集,它将同一种情况下的多个文件描述符放在一起。在include/linux/types.h有中定义:

typedef __kernel_fd_set     fd_set;

__kernel_fd_set结构在include/linux/posix_types.h中定义:

typedef struct {

   unsigned long fds_bits [__FDSET_LONGS];

} __kernel_fd_set;

其中与__FDSET_LONGS有关的一些宏:

#define __NFDBITS  (8 * sizeof(unsigned long))

#undef __FD_SETSIZE

#define __FD_SETSIZE  1024

#undef __FDSET_LONGS

#define __FDSET_LONGS (__FD_SETSIZE/__NFDBITS)

embedded_fd_set结构是小的文件描述符集,它将同一情况下的文件描述符放在一起,只能存放unsigned long类型位数个文件描述符,不过,这对于许多进程已经足够了。

/*

 * The embedded_fd_set is a small fd_set,

 * suitable for most tasks (which open <= BITS_PER_LONG files)

 */

struct embedded_fd_set {

   unsigned long fds_bits[1];

};