共两篇文章:还可以参考linux那些事linx_sysfs
========================================================================================
#include <linux/fs.h>
#include <linux/path.h>
#include <linux/dcache.h>
#include <linux/fdtable.h>
pfile->f_path.dentry;
file_dentry->d_inode->i_uid
================================================================================
首先分析一下sys_read系统调用(内核版本为2.6.19.4)。
源代码如下(摘自fs/read_write.c)
[c-sharp]
1. SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)
2. {
3. struct file *file;
4. ssize_t ret = -EBADF;
5. int fput_needed;
6. file = fget_light(fd, &fput_needed);
7. if (file) {
8. loff_t pos = file_pos_read(file);
9. ret = vfs_read(file, buf, count, &pos);
10. file_pos_write(file, pos);
11. fput_light(file, fput_needed);
12. }
13. return ret;
14. }
这里用到了fget_light(),file_pos_read(),vfs_read(),file_pos_write(),fput_light()。
- file_pos_read()和file_pos_write()(均位于fs/read_write.c)用来读取当前文件指针(即当前文件操作的位置)
- fget_light()和fput_light()(位于fs/file_table.c和include/linux/file.h)必须是成对出现的!fget_light在当前进程的structfiles_struct中根据所谓的用户空间文件描述符fd来获取文件描述符。另外,根据当前fs_struct是否被多各进程共享来判断是否需要对文件描述符进行加锁,并将加锁结果存到一个int中返回, fput_light则根据该结果来判断是否需要对文件描述符解锁
- vfs_read()(位于fs/read_write.c)调用具体文件系统的read函数来完成读操作,代码如下:
[cpp]
1. ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)
2. {
3. ssize_t ret;
4. if (!(file->f_mode & FMODE_READ))
5. return -EBADF;
6. if (!file->f_op || (!file->f_op->read && !file->f_op->aio_read))
7. return -EINVAL;
8. if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))
9. return -EFAULT;
10. ret = rw_verify_area(READ, file, pos, count);
11. if (ret >= 0) {
12. count = ret;
13. if (file->f_op->read)
14. ret = file->f_op->read(file, buf, count, pos);
15. else
16. ret = do_sync_read(file, buf, count, pos);
17. if (ret > 0) {
18. fsnotify_access(file->f_path.dentry);
19. add_rchar(current, ret);
20. }
21. inc_syscr(current);
22. }
23. return ret;
24. }
通过源码可以看出,内核中无法直接使用sys_read()来进行文件操作,因为sys_read()总会在当前进程的structfiles_struct中查找文件。
(除非内核想对当前进程打开的某个文件进行操作,不知道这种情况是否存在)
内核可以使用vfs_read()来进行文件操作,一个例子如下
[cpp]
1. ssize_t nread;
2. loff_t pos;
3. mm_segment_t old_fs;
4. struct file *file=NULL;
5. old_fs = get_fs();
6. set_fs(KERNEL_DS);
7. file = filp_open("filename", O_RDONLY, 0);
8. if(IS_ERR(file))
9. {
10. printk(KERN_INFO"filp open error/n");
11. set_fs(old_fs);
12. return -1;
13. }
14. else
15. printk(KERN_INFO"filp open succeeded/n");
16. pos=0;
17. nread = vfs_read(file, (char __user *)buffer, len, &pos);
18. if(nread < 0)
19. printk(KERN_INFO"vfs_read failed!/n");
20. else if(nread < len)
21. printk(KERN_INFO"vfs_read PART data/n");
22. else
23. printk(KERN_INFO"vfs_read succeeded/n");
24. if(file)filp_close(file, NULL);
25.
26. set_fs(old_fs);
主要区别就是在操作前调用set_fs()(位于arch/x86/boot/boot.h)将当前fs段寄存器设为KERNEL_DS,在完成后再调用该函数将fs段寄存器设为原来的值,这样做的原因尚不明,希望高手指点。
问题:
1.内核中atomic_read()加锁是怎么进行的
2.还可调用kernel_read()(位于fs/exec.c,在include/linux/fs.h中声明)来直接读文件,该函数中完成了fs段期存期的保存,但找不到对应的kernel_write()函数
===================================================================================
有时候需要在Linux kernel--大多是在需要调试的驱动程序--中读写文件数据。在kernel中操作文件没有标准库可用,需要利用kernel的一些函数,这些函数主要有: filp_open() filp_close(), vfs_read() vfs_write(),set_fs(),get_fs()等,这些函数在linux/fs.h和asm/uaccess.h头文件中声明。下面介绍主要步骤
1. 打开文件
filp_open()在kernel中可以打开文件,其原形如下:
strcut file* filp_open(const char* filename, int open_mode, int mode);
该函数返回strcut file*结构指针,供后继函数操作使用,该返回值用IS_ERR()来检验其有效性。
参数说明
filename: 表明要打开或创建文件的名称(包括路径部分)。在内核中打开的文件时需要注意打开的时机,很容易出现需要打开文件的驱动很早就加载并打开文件,但需要打开的文件所在设备还不有挂载到文件系统中,而导致打开失败。
open_mode: 文件的打开方式,其取值与标准库中的open相应参数类似,可以取O_CREAT,O_RDWR,O_RDONLY等。
mode: 创建文件时使用,设置创建文件的读写权限,其它情况可以匆略设为0
2. 读写文件
kernel中文件的读写操作可以使用vfs_read()和vfs_write,在使用这两个函数前需要说明一下get_fs()和 set_fs()这两个函数。
vfs_read() vfs_write()两函数的原形如下:
ssize_t vfs_read(struct file* filp, char __user* buffer, size_t len, loff_t* pos);
ssize_t vfs_write(struct file* filp, const char __user* buffer, size_t len, loff_t* pos);
注意这两个函数的第二个参数buffer,前面都有__user修饰符,这就要求这两个buffer指针都应该指向用空的内存,如果对该参数传递kernel空间的指针,这两个函数都会返回失败-EFAULT。但在Kernel中,我们一般不容易生成用户空间的指针,或者不方便独立使用用户空间内存。要使这两个读写函数使用kernel空间的buffer指针也能正确工作,需要使用set_fs()函数或宏(set_fs()可能是宏定义),如果为函数,其原形如下:
void set_fs(mm_segment_t fs);
该函数的作用是改变kernel对内存地址检查的处理方式,其实该函数的参数fs只有两个取值:USER_DS,KERNEL_DS,分别代表用户空间和内核空间,默认情况下,kernel取值为USER_DS,即对用户空间地址检查并做变换。那么要在这种对内存地址做检查变换的函数中使用内核空间地址,就需要使用set_fs(KERNEL_DS)进行设置。get_fs()一般也可能是宏定义,它的作用是取得当前的设置,这两个函数的一般用法为:
mm_segment_t old_fs;
old_fs = get_fs();
set_fs(KERNEL_DS);
...... //与内存有关的操作
set_fs(old_fs);
还有一些其它的内核函数也有用__user修饰的参数,在kernel中需要用kernel空间的内存代替时,都可以使用类似办法。
使用vfs_read()和vfs_write()最后需要注意的一点是最后的参数loff_t * pos,pos所指向的值要初始化,表明从文件的什么地方开始读写。
3. 关闭读写文件
int filp_close(struct file*filp, fl_owner_t id);
该函数的使用很简单,第二个参数一般传递NULL值,也有用current->files作为实参的。
使用以上函数的其它注意点:
1. 其实Linux Kernel组成员不赞成在kernel中独立的读写文件(这样做可能会影响到策略和安全问题),对内核需要的文件内容,最好由应用层配合完成。
2. 在可加载的kernel module中使用这种方式读写文件可能使模块加载失败,原因是内核可能没有EXPORT你所需要的所有这些函数。
3. 分析以上某些函数的参数可以看出,这些函数的正确运行需要依赖于进程环境,因此,有些函数不能在中断的handle或Kernel中不属于任可进程的代码中执行,否则可能出现崩溃,要避免这种情况发生,可以在kernel中创建内核线程,将这些函数放在线程环境下执行(创建内核线程的方式请参数kernel_thread()函数)。