一、select

    1.select简介

    系统提供select函数来实现多路复用输入/输出模型。select系统调用是用来让我们的程序监视多个文件句柄的状态变化的。程序会停在select这里等待,直到被监视的文件句柄有一个或多个发生了状态改变。

    文件句柄,其实就是一个整数,我们最熟悉的句柄是0、1、2三 个,0是标准输入,1是标准输出,2是标准错误输出。0、1、2是整数表示的,对应的FILE * 结构的表示就是stdin、stdout、stderr。

     2.select函数

I/O多路转接之select、poll、epoll_epoll

    (1)参数nfds是需要监视的最大的文件描述符值+1; 

    (2)rdset,wrset,exset分别对应于需要检测的可读文件描述符的集合,可写文件描述符的集合及异常文件描述符的集合。 

    (3)参数timeout为结构timeval,用来设置select()的等待时间。

    struct timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件发生则函数返回,返回值为0。

    I/O多路转接之select、poll、epoll_select_02

     (4)FD_CLR(inr fd,fd_set* set);用来清除描述词组set中相关fd 的位。 

         FD_ISSET(int fd,fd_set *set);用来测试描述词组set中相关fd 的位是否为真。

         FD_SET(int fd,fd_set*set);用来设置描述词组set中相关fd的位。 

         FD_ZERO(fd_set *set);用来清除描述词组set的全部位。 

二、poll

    不同与select使用三个位图来表示三个fdset的方式,poll使用一个 pollfd的指针实现。 

    I/O多路转接之select、poll、epoll_epoll_03

    pollfd结构包含了要监视的event和发生的event,不再使用select“参数-值”传递的方式。同时, pollfd并没有最大数量限制(但是数量过大后性能也是会下降)。和select函数一样,poll返回后,需要轮询pollfd来获取就绪的描述符。

三、epoll

    epoll是为处理大批量句柄而作了改进的poll。当然,这不是 2.6内核才有的,它是在2.5.44内核中被引进的(epoll(4) is a new API introduced in Linux kernel 2.5.44),它几乎具备了之前所说的一切优点,被公认为Linux2.6下性能最好的多路I/O就绪通知方法。  

    epoll只有epoll_create,epoll_ctl,epoll_wait 3个系统调用。  

    1.int epoll_create(int size); 

    创建一个epoll的句柄。自从linux2.6.8之后,size参数是被忽略的。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。 

    2.int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

    epoll的事件注册函数,它不同于select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。

    (1)第一个参数是epoll_create()的返回值。 

    (2)第二个参数表示动作,用三个宏来表示: 

    EPOLL_CTL_ADD:注册新的fd到epfd中;

    EPOLL_CTL_MOD:修改已经注册的fd的监听事;

    EPOLL_CTL_DEL:从epfd中删除一个fd; 

    (3)第三个参数是需要监听的fd。

    (4) 第四个参数是告诉内核需要监听什么事,struct epoll_event结构如下:

    I/O多路转接之select、poll、epoll_select_04

    EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭); 

    EPOLLOUT:表示对应的文件描述符可以写; 

    EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来); 

    EPOLLERR:表示对应的文件描述符发生错误; 

    EPOLLHUP:表示对应的文件描述符被挂断; 

    EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的;

    在将RFD添加到epoll描述符的时候使用了EPOLLET标志,那么在调用 epoll_wait之后将有可能会挂起,因为剩余的数据还存在于文件的输入缓冲区内,而且数据发出端还在等待一个针对已经发出数据的反馈信息。只有在监视的文件句柄上发生了某个事件的时候 ET工作模式才会汇报事件。因此在调用epoll_wait之后,调用者可能会放弃等待仍在存在于文件输入缓冲区内的剩余数据。epoll工作在ET模式的时候,必须使用非阻塞套接口,以避免由于一个文件 句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。

    以LT方式调用epoll接口的时候,它就相当于一个速度比较快的poll,并且无论后面的数据是否被使用,因此他们具有同样的职能。因为即使使用ET模式的epoll,在收到多 个chunk的数据的时候仍然会产生多个事件。调用者可以设定EPOLLONESHOT标志,在 epoll_wait收到事件后epoll会与事件关联的文件句柄从epoll描述符中禁止掉。因此当 EPOLLONESHOT设定后,使用带有 EPOLL_CTL_MOD标志的epoll_ctl处理文件句柄就 成为调用者必须作的事情。  

    EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个 socket的话,需要再次把这个socket加入到EPOLL队列里。

    3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);     

    收集在epoll监控的事件中已经发送的事件。参数events是分配好的epoll_event结构体数组,epoll将会把发生的事件赋值到events数组中(events不可以是空指针,内核只负责把数据复 制到这个events数组中,不会去帮助我们在用户态中分配内存)。maxevents告之内核这个 events有多大,这个 maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时 时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。如果函数调用成功,返回对应I/O上已准备好的文件描述符数目,如返回0表示已超时。     

四、select、poll、epoll的比较

    每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大;同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大;select支持的文件描述符数量太小了,默认是1024。 

    select和poll都需要在返回后,通过遍历文件描述符来获取已经就绪的socket。事实上,同时连接的大量客户端在一时刻可能只有很少的处于就绪状态,因此随着监视的描 述符数量的增长,其效率也会线性下降。

    epoll支持一个进程打开大数目的socket描述符(FD);.IO效率不随FD数目增加而线性下降;.使用mmap加速内核与用户空间的消息传递。

    select/poll每次调用时都要传递。你所要监控的所有socket给select/poll系统调用,这意味着需要将用户态的socket列表copy到内核态,如果以万计的句柄会导致每次都要copy几十几百KB的内存到内核态,非常低效。而我们调用epoll_wait时就相当于以往调用select/poll,但是这时却不用传递socket句柄给内核,因为内核已经在epoll_ctl中拿到了要监控的句柄列表。