虚拟文件系统(VFS)是由Sunmicrosystems公司在定义网络文件系统(NFS)时创造的。它是物理文件系统与服务之间的一个接口层,是对整个操作系统每个文件系统的抽象,因此,严格的说,它并不是具体的文件系统。它存在于内存中,不存在任何外存空间。

       无意中阅读到云风在github上的Windsoul源码,感受到了高手代码的扎实,也体会到了思考后的设计之美。虽然早前Linux已实现了VFS,但对于初学者来说过于复杂且需要丰富的阅读Linux源码的经验,每每想到剖析某文件系统的痛苦,内心总有些许气馁。通常情况下,阅读代码往往比写代码来得困难得多。因此,培养良好的阅读兴趣,懂得欣赏他人优秀的设计艺术显得尤为重要了。

一、初始化

        阅读代码的关键在于确定在何处开始阅读。大部分时间内我们选择从代码的初始化开始。

虚拟文件系统虽然不同于具体文件系统,但基本原理是一致的,包括初始化。对于一个文件系统,要想使用它,必须得先知道它的根目录。Windsoul是通过VfsInit函数进行初始化的。如下

1. Int VfsInit(void)  
2.
3. {
4.
5. vfsMount(“_”,”native”,”.”);
6.
7. }

函数vfsMount的主要流程是首先取得”.”的绝对路径,然后为nativefs结构体变量fs分配内存,fs->sz的值为该路径的字符串大小,fs->root存储该路径。好,我们先放下源码仔细思考一下,既然我们保存了某个路径的信息,我们该如何操作它呢?答案是多种的,可读、可写、可定位等等。如果将这些信息进行汇编,就可以得到一个文件系统的基本数据结构。云风是这么定义的:

 


1. struct filesystem {  
2.
3. void * fs;
4.
5. int (*list)(void *fs,const char *name, atom *buffer, int sz);
6.
7. int (*chsize)(void *fs,const char *name, size_t sz);
8.
9. int (*create)(void*fs,const char *name, char mode);
10.
11. size_t (*size)(void *fs, const char *name);
12.
13. int (*read)(void *fs ,const char *name, size_t pos, void *buffer, int sz);
14.
15. int (*write)(void *fs , const char *name,size_t pos, const void *buffer, int sz);
16.
17. };


 

其中fs指向的是刚才填充的nativefs类型变量fs。

vfsMount函数会将struct filesystem * fs进行填充:

    1. fs = memoryPermanent(sizeof(*fs));  
    2.
    3. sizeof(*fs));
    4.
    5. fs->fs = f;
    6.
    7. fs->list = nativefsList;
    8.
    9. fs->create = nativefsCreate;
    10.
    11. fs->read = nativefsRead;


    接着,会调用void pathMount(const char * root, struct filesystem *fs)函数,将刚才的fs作为实参传进去。这个函数将实现文件的挂载。

    我们现在看看他是怎样实现的。首先,他维护了一个struct map *g_fs全局变量:

    1. struct map {  
    2.
    3. int freenode;
    4.
    5. int size;
    6.
    7. struct node* buffer;
    8.
    9. };

    Freenode指向可用的文件节点首地址,size表示,buffer则指向了一片空间,该空间存储着各个文件节点。而这些节点的数据结构是:

    1. struct node {  
    2.
    3. struct value *value;
    4.
    5. struct key *key;
    6.
    7. struct node *next;
    8.
    9. };

    通过这个结构体可知,各个文件节点形成了一个单链表。Key存储的是路径的哈希值,value指向的是该文件节点的struct filesystem类型的文件句柄。

    因此,pathMount函数的实现如下:

     


    1. voidpathMount(const char * root, struct filesystem *fs)  
    2.
    3. {
    4.
    5. struct map_op op;
    6.
    7. op.op = MAP_INSERT;
    8.
    9. op.key.p = atomString(root);
    10.
    11. op.value = fs;
    12.
    13. void * old = mapSearch(g_fs,&op);
    14.
    15. if (old!=NULL) {
    16.
    17. "%s is alreadymounted.",atomToString(op.key.p));
    18.
    19. }
    20.
    21. }


    函数mapSearch是将文件句柄插入到buffer指向的哈希表中。原理图如下:

    二、vfsOpen函数操作

    既然我们已经得到了一个系统初始化的结构体,那么操作就变得简单了。这里只是拿vfsOpen函数作示范,其他操作类似,不在赘述。

    假设我们要在当前目录下新建一个文件“a/b.dat”,那么我们该怎么做呢?当然我们先得到b.dat文件名,其次是得到目录a。Windsoul维护了两个哈希表,一个为上图所示,一个为存储目录的哈希表,下图所示:

    文件夹a首先跟struct hash_string中的str值进行比较,也就是跟最近使用的目录比较。如果相等,则返回该哈希表项;如果不成功,则将a填充到str里,作为当前使用的目录。最后,将a重新进行一次哈希,在全局变量g_fs维护的哈希表中找到其所对应的struct filesystem fs句柄,最后进行具体的文件操作。

    1. struct file {  
    2.
    3. struct filesystem *fs;
    4.
    5. const char * name;
    6.
    7. size_t size;
    8.
    9. size_t pos;
    10.
    11. int mode;
    12.
    13. };
    14.
    15.
    16.
    17. struct file *vfsOpen(atom pathname, const char * m)
    18.
    19. {
    20.
    21. const char *name=NULL;
    22.
    23. struct filesystem * fs = pathGet(pathname,&name);
    24.
    25. if (fs == NULL)
    26.
    27. return NULL;
    28.
    29. int mode = 0;
    30.
    31. if (strchr(m,'r')) {
    32.
    33. mode |= MODE_READ;
    34.
    35. if (fs->read == NULL)
    36.
    37. return NULL;
    38.
    39. }
    40.
    41. if (strchr(m,'w')) {
    42.
    43. mode |= MODE_WRITE;
    44.
    45. if (fs->write == NULL)
    46.
    47. return NULL;
    48.
    49. }
    50.
    51. if (mode & (MODE_WRITE|MODE_READ)) {
    52.
    53. if(!fs->create(fs->fs,name,'q')) {
    54.
    55. if(!fs->create(fs->fs,name,'c')) {
    56.
    57. return NULL;
    58.
    59. }
    60.
    61. }
    62.
    63. else if (mode & MODE_WRITE) {
    64.
    65. if(!fs->create(fs->fs,name,'c')) {
    66.
    67. return NULL;
    68.
    69. }
    70.
    71. else if (mode & MODE_READ) {
    72.
    73. if(!fs->create(fs->fs,name,'q')) {
    74.
    75. return NULL;
    76.
    77. }
    78.
    79. else {
    80.
    81. return NULL;
    82.
    83. }
    84.
    85.
    86.
    87. size_t sz = fs->size(fs->fs,name);
    88.
    89. if (sz == NONE_EXIST) {
    90.
    91. return NULL;
    92.
    93. }
    94.
    95. struct file *f = memoryAlloc(sizeof(structfile));
    96.
    97. f->fs = fs;
    98.
    99. f->name = name;
    100.
    101. f->size = sz;
    102.
    103. f->pos = 0;
    104.
    105. f->mode = mode;
    106.
    107. return f;
    108.
    109. }

    关键操作是pathGet函数。它的功能就是实现在g_map中修改其当前目录,并在g_fs找到struct filesystem类型的文件句柄,最后产生一个文件。

     

    三、其他

    Windsoul的其他操作无非是修改g_map所对应的当前目录字符,这里就不一一阐述了,而整个文件系统是对读写文件的一次包装,这样有利于安装我们常人的思维操作文件,这个概念跟内存管理(如内存池)是一致的。

    如果在细细回味这些代码,你会发现一些具体力道的设计。当然这些设计是有根据的,比如整个项目中都穿插这原子(Atom)的概念,其实这里是引自《C语言接口与设计》的某些内容。这里给我们的启示是平时多阅读代码,起码多阅读一些书籍,并且学以致用,有自己的思考,只有这样才能达到高手的境界。