共两篇文章:还可以参考linux那些事linx_sysfs

========================================================================================
#include <linux/fs.h>
 #include <linux/path.h>
 #include <linux/dcache.h>
 #include <linux/fdtable.h> 

 pfile->f_path.dentry; 

file_dentry->d_inode->i_uid
================================================================================

首先分析一下sys_read系统调用(内核版本为2.6.19.4)。

源代码如下(摘自fs/read_write.c)

[c-sharp] 

1. SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)  
2. {  
3.     struct file *file;  
4. ssize_t ret = -EBADF;  
5.     int fput_needed;  
6. file = fget_light(fd, &fput_needed);  
7.     if (file) {  
8. loff_t pos = file_pos_read(file);  
9. ret = vfs_read(file, buf, count, &pos);  
10. file_pos_write(file, pos);  
11. fput_light(file, fput_needed);  
12. }  
13.     return ret;  
14. }

这里用到了fget_light(),file_pos_read(),vfs_read(),file_pos_write(),fput_light()。

 

  • file_pos_read()和file_pos_write()(均位于fs/read_write.c)用来读取当前文件指针(即当前文件操作的位置)
  • fget_light()和fput_light()(位于fs/file_table.c和include/linux/file.h)必须是成对出现的!fget_light在当前进程的structfiles_struct中根据所谓的用户空间文件描述符fd来获取文件描述符。另外,根据当前fs_struct是否被多各进程共享来判断是否需要对文件描述符进行加锁,并将加锁结果存到一个int中返回, fput_light则根据该结果来判断是否需要对文件描述符解锁
  • vfs_read()(位于fs/read_write.c)调用具体文件系统的read函数来完成读操作,代码如下:

[cpp]

1. ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)  
2. {  
3. ssize_t ret;  
4.     if (!(file->f_mode & FMODE_READ))  
5.         return -EBADF;  
6.     if (!file->f_op || (!file->f_op->read && !file->f_op->aio_read))  
7.         return -EINVAL;  
8.     if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))  
9.         return -EFAULT;  
10. ret = rw_verify_area(READ, file, pos, count);  
11.     if (ret >= 0) {  
12. count = ret;  
13.         if (file->f_op->read)  
14. ret = file->f_op->read(file, buf, count, pos);  
15.         else  
16. ret = do_sync_read(file, buf, count, pos);  
17.         if (ret > 0) {  
18. fsnotify_access(file->f_path.dentry);  
19. add_rchar(current, ret);  
20. }  
21. inc_syscr(current);  
22. }  
23.     return ret;  
24. }

 

通过源码可以看出,内核中无法直接使用sys_read()来进行文件操作,因为sys_read()总会在当前进程的structfiles_struct中查找文件。

(除非内核想对当前进程打开的某个文件进行操作,不知道这种情况是否存在)

内核可以使用vfs_read()来进行文件操作,一个例子如下

[cpp] 

1. ssize_t nread;  
2. loff_t pos;  
3. mm_segment_t old_fs;  
4. struct file *file=NULL;  
5. old_fs = get_fs();  
6. set_fs(KERNEL_DS);  
7. file = filp_open("filename", O_RDONLY, 0);  
8. if(IS_ERR(file))  
9. {  
10. printk(KERN_INFO"filp open error/n");  
11. set_fs(old_fs);  
12.     return -1;  
13. }  
14. else  
15. printk(KERN_INFO"filp open succeeded/n");  
16. pos=0;  
17. nread = vfs_read(file, (char __user *)buffer, len, &pos);  
18. if(nread < 0)  
19. printk(KERN_INFO"vfs_read failed!/n");  
20. else if(nread < len)  
21. printk(KERN_INFO"vfs_read PART data/n");  
22. else  
23. printk(KERN_INFO"vfs_read succeeded/n");  
24. if(file)filp_close(file, NULL);  
25.   
26. set_fs(old_fs);

主要区别就是在操作前调用set_fs()(位于arch/x86/boot/boot.h)将当前fs段寄存器设为KERNEL_DS,在完成后再调用该函数将fs段寄存器设为原来的值,这样做的原因尚不明,希望高手指点。

问题:

1.内核中atomic_read()加锁是怎么进行的

2.还可调用kernel_read()(位于fs/exec.c,在include/linux/fs.h中声明)来直接读文件,该函数中完成了fs段期存期的保存,但找不到对应的kernel_write()函数

===================================================================================


有时候需要在Linux kernel--大多是在需要调试的驱动程序--中读写文件数据。在kernel中操作文件没有标准库可用,需要利用kernel的一些函数,这些函数主要有: filp_open() filp_close(), vfs_read() vfs_write(),set_fs(),get_fs()等,这些函数在linux/fs.h和asm/uaccess.h头文件中声明。下面介绍主要步骤

1. 打开文件

  filp_open()在kernel中可以打开文件,其原形如下:

  strcut file* filp_open(const char* filename, int open_mode, int mode);

  该函数返回strcut file*结构指针,供后继函数操作使用,该返回值用IS_ERR()来检验其有效性。

  参数说明

  filename: 表明要打开或创建文件的名称(包括路径部分)。在内核中打开的文件时需要注意打开的时机,很容易出现需要打开文件的驱动很早就加载并打开文件,但需要打开的文件所在设备还不有挂载到文件系统中,而导致打开失败。

  open_mode: 文件的打开方式,其取值与标准库中的open相应参数类似,可以取O_CREAT,O_RDWR,O_RDONLY等。

  mode:  创建文件时使用,设置创建文件的读写权限,其它情况可以匆略设为0

2. 读写文件

  kernel中文件的读写操作可以使用vfs_read()和vfs_write,在使用这两个函数前需要说明一下get_fs()和 set_fs()这两个函数。

  vfs_read() vfs_write()两函数的原形如下:

  ssize_t vfs_read(struct file* filp, char __user* buffer, size_t len, loff_t* pos);

  ssize_t vfs_write(struct file* filp, const char __user* buffer, size_t len, loff_t* pos);

  注意这两个函数的第二个参数buffer,前面都有__user修饰符,这就要求这两个buffer指针都应该指向用空的内存,如果对该参数传递kernel空间的指针,这两个函数都会返回失败-EFAULT。但在Kernel中,我们一般不容易生成用户空间的指针,或者不方便独立使用用户空间内存。要使这两个读写函数使用kernel空间的buffer指针也能正确工作,需要使用set_fs()函数或宏(set_fs()可能是宏定义),如果为函数,其原形如下:

  void set_fs(mm_segment_t fs);

  该函数的作用是改变kernel对内存地址检查的处理方式,其实该函数的参数fs只有两个取值:USER_DS,KERNEL_DS,分别代表用户空间和内核空间,默认情况下,kernel取值为USER_DS,即对用户空间地址检查并做变换。那么要在这种对内存地址做检查变换的函数中使用内核空间地址,就需要使用set_fs(KERNEL_DS)进行设置。get_fs()一般也可能是宏定义,它的作用是取得当前的设置,这两个函数的一般用法为

  mm_segment_t old_fs;

  old_fs = get_fs();

  set_fs(KERNEL_DS);

  ...... //与内存有关的操作

  set_fs(old_fs);

  还有一些其它的内核函数也有用__user修饰的参数,在kernel中需要用kernel空间的内存代替时,都可以使用类似办法。

  使用vfs_read()和vfs_write()最后需要注意的一点是最后的参数loff_t * pos,pos所指向的值要初始化,表明从文件的什么地方开始读写。

3. 关闭读写文件

  int filp_close(struct file*filp, fl_owner_t id);

  该函数的使用很简单,第二个参数一般传递NULL值,也有用current->files作为实参的。

  使用以上函数的其它注意点:

  1. 其实Linux Kernel组成员不赞成在kernel中独立的读写文件(这样做可能会影响到策略和安全问题),对内核需要的文件内容,最好由应用层配合完成。

  2. 在可加载的kernel module中使用这种方式读写文件可能使模块加载失败,原因是内核可能没有EXPORT你所需要的所有这些函数。

  3. 分析以上某些函数的参数可以看出,这些函数的正确运行需要依赖于进程环境,因此,有些函数不能在中断的handle或Kernel中不属于任可进程的代码中执行,否则可能出现崩溃,要避免这种情况发生,可以在kernel中创建内核线程,将这些函数放在线程环境下执行(创建内核线程的方式请参数kernel_thread()函数)。