一、Nginx简介
Nginx是一个开源且高性能、可靠的HTTP中间件、代理服务.
开源:直接获取源代码
高性能:支持海量高并发
1、nginx应用场景:
静态处理 (对静态页面的处理,不管是httpd还是nginx默认只能处理静态页面)
反向代理 (不直接处理客户端请求,而是将请求转交给其它服务器)
负载均衡 (长跟反向代理相结合,负责将客户端的请求转交给其它压力较小的服务器)
资源缓存 (对客户端经常访问的数据进行缓存,从而加快客户端的访问速度)
安全防护 (nginx对自己本身有一定防护措施)
访问限制 (有点类似于apache的order deny,allow)
访问认证 (对所访问网站,进行添加用户名和密码)
单apache:同时处理客户端的理想值是2w
单nginx: 同时处理客户端的理想值是5w
nginx是一个高性能的HTTP和反向代理web服务器,同时也提供了IMAP/POP3/SMTP服务.众所周知nginx相比于Apache有更高的并发,可以接收处理更多的访问请求,这得益于IO模型,下面为大家介绍IO模型
二、I/O模型介绍
每次I/O,都要经由两个阶段
第一步:将数据从磁盘文件先加载至内核空间(缓冲区),等待数据准备完成,时间较长
第二步:将数据从内核缓存区复制到用户空间的进程的内存中,时间较短
3、同步异步,阻塞和非阻塞
同步异步的区别:
同步 : 被调用者不会返回任务的状态,需要调用者不停询问
异步 : 被调用者会向调用者返回任务的状态,不需要调用者不停询问
IO多路复用(select,epoll),异步阻塞
用户进程找一个代理select,而不直接与内核打交道,系统调用交于select进行处理。
用户进程收到资源从磁盘写入内核缓冲区信息后,将内核缓冲区内容复制到用户空间。
select接待用户进程不是一对一的方式,而是一对多。用户进程依旧阻塞于select调用。这个有点像吃饭,客人和服务员之间的关系,>客人不会和后厨打交道,交由服务员完成。
IO多路复用只能成为异步阻塞模型,因阻塞在IO调用那里,但一个select可以检测多个IO模型,相比与同步阻塞只能检测一个提高了cpu的利用率。
信号驱动型 (异步半阻塞)Apache
即用户进程建立SIGIO的信号处理程序,复制数据从磁盘到内核空间,等处理完递交SIGIO告知用户进程,这个过程是不阻塞的状态。
用户进程从内核空间复制到用户应用空间,这个过程是阻塞的。
信号驱动并未完全解决问题,只是做到了一部分不阻塞,一部分阻塞。
异步IO模型 (异步非阻塞) Nginx
用户进程不受阻塞,所有的请求,拿数据拷贝到应用空间都由内核完成,用户进程可以接收更多的用户请求.
三、高并发原理
nginx高并发使用的是epoll的方式,提供给用户访问,复制数据的一些操作交由内核完成.自身做的事情越少接待的用户请求就越多.
epoll在linux2.6中增加了内存拷贝mmap机制,加速与内核空间的消息传递,既内存映射.
内存映射机制:磁盘中有数据,数据有对应的inode号,在内存中映射一个相同的inode好,大小也相同,下次拿数据不需要遍历inode号,分析路径了,这样提高了效率.
select 缺点
1. 能够监视文件描述符的数量存在最大机制
2. 线程遍历扫描效率低下
epool 模型
1. 每当FD就绪,采用系统的回调函数直接将FD放入,效率更高
2. 最大连接无限制
CPU亲和(affinity)
将CPU核⼼和Nginx⼯作进程绑定⽅式,把每个worker进程固定在⼀个cpu上执⾏,减少切换cpu 的 cache miss ,获得更好的性能。
sendfile
传统⽂件传输, 在实现上其实是⽐较复杂的, 其具体流程细节如下:
1.调⽤read函数,⽂件数据被复制到内核缓冲
2.read函数返回,⽂件数据从内核缓冲区复制到⽤户缓冲区
3.write函数调⽤,将⽂件数据从⽤户缓冲区复制到内核与socket相关的缓冲区。
4.数据从socket缓冲区复制到相关协议引擎。
传统⽂件传输数据实际上是经过了四次复制操作:
硬盘—>内核buf—>⽤户buf—>socket缓冲区(内核)—>协议引擎
也就是说传统的⽂件传输需要经过多次上下⽂的切换才能完成拷贝或读取,