Linux kernel 2.2之前,(如图)读写数据基本都是使用read系统调用和write系调用,以nginx来说如果一个请求建立,从磁盘的文件到网络连接之间会通过硬件(DMA)---内核层---用户层多次读写系统来完成文件数据的复制传输:从内核层用read系统调用读到用户层,再从用户层用write系统调用写到内核层,每一次用户层到内核层的进行一次上下文转换,这种代价是非常昂贵的。甚至在没有数据变化时这种复制尤其显得多余。如果nginx接受大量并发请求,这种系统调用就会非常频繁,服务器的性能就会下降。

 

wKiom1OC_0Oih4A7AADfiB_7GRE907.jpg

 

在Linux kernel2.2版本之后出现了一种叫做“零拷贝(zero-copy)”系统调用机制,目前很多应用服务器如apache、samba、nginx都支持sendfile。注意:sendfile系统调用是一种文件传输的系统调用和kernel系统调用关系不大。

 

wKiom1ODB92wC3m3AADAG83M0Mg738.jpg

 

如图所示,nginx在支持了sendfile系统调用后,避免了内核层与用户层的上线文切换(content swith)工作,大大减少了系统性能的开销。

可以使用man 8 sendfile 进一步了解sendfile系统调用。

wKioL1ODENTx2Hf5AADvMSIdktA859.jpg

以下是对参数解释

out_fd

a file descriptor, open for writing, for the data to be written

in_fd

a file descriptor, open for reading, for the data to be read

offset

the offset in the input file to start transfer (e.g. a value of 0 indicates the beginning of the file). This is passed into the function and updated when the function returns.

count

the number of bytes to be transferred

正常情况下函数会返回被写入的字节数,如果出错就返回-1

我们都知道在linux系统里文件描述符fd,可以是一个真实的文件或者是一个设备,例如一个网络socket,(当然linux世界里一切皆文件,这里只是具体区别一下。)senfile需要输入的文件描述符是一个支持mmap的真实文件或者设备,那么socket就不能作为输入的fd,而输出的fd是可以的。

具体在nginx的使用中可以通过在配置文件nginx.conf中增加参数使用sendfile

http {

        sendfile on;

        tcp_nopush on;

        tcp_nodelay on;        

        ...........................

}