Linux 多路转接 —— poll_c++

poll🤣

poll 也是系统提供的一个多路转接接口。poll 系统调用也可以让程序同时监视多个文件描述符上的事件是否就绪,和 select 定位是一样的,适用场景也是一样的。

Linux 多路转接 —— poll_服务器_02

int poll(struct pollfd *fds, nfds_t nfds, int timeout);

fds 为一个 poll 函数监视的结构列表,每一个元素包含三部分内容:文件描述符、监视的事件集合、就绪的事件集合nfds 为 fds 数组长度。timeout 为poll函数的超时时间,单位是毫秒(ms)。

timeout 可取值:

-1:poll 调用后阻塞等待,直到被监视的某个文件描述符上的某个事件就绪。
0:poll 调用后非阻塞等待,无论被监视的文件描述符上的事件是否就绪,poll 检测后都会立即返回。
特定的时间值:poll 调用后在指定的时间内进行阻塞等待,如果被监视的文件描述符上一直没有事件就绪,则在该时间后 poll 进行超时返回。

函数调用成功则返回有事件就绪的文件描述符个数。如果 timeout 时间耗尽,则返回 0。如果函数调用失败,则返回 -1,同时错误码会被设置。

在 poll 调用失败后会设置错误码,具体分为四种错误码:

EFAULT:fds数组不包含在调用程序的地址空间中。
EINTR:此调用被信号所中断。
EINVAL:nfds值超过RLIMIT_NOFILE值。
ENOMEM:核心内存不足。

struct pollfd🤣

struct pollfd 结构当中包含三个成员:

fd:特定的文件描述符,若设置为负值则忽略events字段并且revents字段返回0。

events:需要监视该文件描述符上的哪些事件。

revents:poll函数返回时告知用户该文件描述符上的哪些事件已经就绪。

Linux 多路转接 —— poll_文件描述符_03


events 和 revents 的取值:

Linux 多路转接 —— poll_网络_04


这些取值实际都是以宏的方式进行定义的,它们的二进制序列中有且仅有一个比特位是1,且为 1 的比特位是各不相同的

Linux 多路转接 —— poll_c++_05

因此在调用poll函数之前,可以通过 | 运算符将要监视的事件添加到 events 中。poll 返回后,可以通过 & 运算符检测 revents 成员中是否包含特定事件,以得知对应文件描述符的特定事件是否就绪

poll 服务器😘

poll 工作流程和 select 是基本类似的,这里我们也实现一个简单poll服务器,该服务器也只是读取客户端发来的数据并进行打印。

PollServer类😁

PollServer类当中只需要包含监听套接字和端口号两个成员变量,在 poll 服务器绑定时直接将 IP 地址设置为INADDR_ANY即可。

在构造 PollServer 对象时,需要指明 poll 服务器端口号,当然也可以在初始化 poll 服务器的时候指明。
在初始化 poll 服务器的时候调用 Socket 类中的函数,依次进行套接字的创建、绑定和监听即可,这里的 Socket 类和之前实现的一样。
在析构函数中可以选择调用 close 函数将监听套接字进行关闭,但实际也可以不进行该动作,因为服务器运行后一般是不退出的。
代码如下:

#pragma once

#include "socket.hpp"
#include <poll.h>

#define BACK_LOG 5

class PollServer{
private:
	int _listen_sock; //监听套接字
	int _port; //端口号
public:
	PollServer(int port)
		: _port(port)
	{}
	void InitPollServer()
	{
		_listen_sock = Socket::SocketCreate();
		Socket::SocketBind(_listen_sock, _port);
		Socket::SocketListen(_listen_sock, BACK_LOG);
	}
	~PollServer()
	{
		if (_listen_sock >= 0){
			close(_listen_sock);
		}
	}
};

运行服务器😒

服务器初始化完后开始运行,而 poll 服务器要做的就是不断调用 poll 函数,当事件就绪时执行动作即可。

首先,在 poll 服务器开始死循环调用 poll 函数之前,需要定义一个 fds 数组,该数组当中的每个位置都是一个struct pollfd结构,后续调用 poll 函数时会作为参数进行传入。先将 fds 数组当中每个位置初始化为无效,并将监听套接字添加到 fds 数组当中,表示服务器刚开始运行时只需要监视监听套接字的读事件。

此后,poll 服务器就不断调用 poll 函数监视读事件是否就绪。如果返回值大于0,说明 poll 调用成功,此时已经有文件描述符的读事件就绪,接下来就应该对就绪事件进行处理。如果返回值等于0,则说明 timeout 时间耗尽,此时直接准备进行下一次 poll 调用即可。如果返回值为-1,则说明 poll 调用失败,此时也让服务器准备进行下一次 poll 调用,但实际应该进一步判断错误码,根据错误码来判断是否应该继续调用 poll 函数。

#pragma once

#include "socket.hpp"
#include <poll.h>

#define BACK_LOG 5
#define NUM 1024
#define DFL_FD - 1

class PollServer{
private:
	int _listen_sock; //监听套接字
	int _port; //端口号
public:
	void Run()
	{
		struct pollfd fds[NUM];
		ClearPollfds(fds, NUM, DFL_FD); //清空数组中的所有位置
		SetPollfds(fds, NUM, _listen_sock); //将监听套接字添加到数组中,并关心其读事件
		for (;;){
			switch (poll(fds, NUM, -1)){
			case 0:
				std::cout << "timeout..." << std::endl;
				break;
			case -1:
				std::cerr << "poll error" << std::endl;
				break;
			default:
				//正常的事件处理
				//std::cout<<"有事件发生..."<<std::endl;
				HandlerEvent(fds, NUM);
				break;
			}
		}
	}
private:
	void ClearPollfds(struct pollfd fds[], int num, int default_fd)
	{
		for (int i = 0; i < num; i++){
			fds[i].fd = default_fd;
			fds[i].events = 0;
			fds[i].revents = 0;
		}
	}
	bool SetPollfds(struct pollfd fds[], int num, int fd)
	{
		for (int i = 0; i < num; i++){
			if (fds[i].fd == DFL_FD){ //该位置没有被使用
				fds[i].fd = fd;
				fds[i].events |= POLLIN; //添加读事件到events当中
			return true;
			}
		}
		return false; //fds数组已满
	}
};

事件处理😁

当 poll 检测到有文件描述符的读事件就绪,就会在其对应的 struct pollfd 结构中的 revents 成员中添加读事件并返回,接下来 poll 服务器就应该对就绪事件进行处理了,事件处理过程如下:

首先遍历 fds 数组中的每个 struct pollfd 结构,如果该结构当中的 fd 有效,且 revents 当中包含读事件,则说明该文件描述符的读事件就绪,接下来就需要进一步判断该文件描述符是监听套接字还是与客户端建立的套接字。

如果是监听套接字的读事件就绪,则调用 accept 函数将底层建立好的连接获取上来,并将获取到的套接字添加到 fds 数组当中,表示下一次调用 poll 函数时需要监视该套接字的读事件。

如果是与客户端建立的连接对应的读事件就绪,则调用 read 函数读取客户端发来的数据,并将读取到的数据在服务器端进行打印。如果在调用 read 时发现客户端将连接关闭或 read 调用失败,则服务器也应关闭对应的连接,并将该连接对应的文件描述符从 fds 数组当中清除,表示下一次调用 poll 时无需再监视该套接字的读事件。

#pragma once

#include "socket.hpp"
#include <poll.h>

#define BACK_LOG 5
#define NUM 1024
#define DFL_FD - 1

class PollServer{
private:
	int _listen_sock; //监听套接字
	int _port; //端口号
public:
	void HandlerEvent(struct pollfd fds[], int num)
	{
		for (int i = 0; i < num; i++){
			if (fds[i].fd == DFL_FD){ //跳过无效的位置
				continue;
			}
			if (fds[i].fd == _listen_sock&&fds[i].revents&POLLIN){ //连接事件就绪
				struct sockaddr_in peer;
				memset(&peer, 0, sizeof(peer));
				socklen_t len = sizeof(peer);
				int sock = accept(_listen_sock, (struct sockaddr*)&peer, &len);
				if (sock < 0){ //获取连接失败
					std::cerr << "accept error" << std::endl;
					continue;
				}
				std::string peer_ip = inet_ntoa(peer.sin_addr);
				int peer_port = ntohs(peer.sin_port);
				std::cout << "get a new link[" << peer_ip << ":" << peer_port << "]" << std::endl;
				
				if (!SetPollfds(fds, NUM, sock)){ //将获取到的套接字添加到fds数组中,并关心其读事件
					close(sock);
					std::cout << "poll server is full, close fd: " << sock << std::endl;
				}
			}
			else if (fds[i].revents&POLLIN){ //读事件就绪
				char buffer[1024];
				ssize_t size = read(fds[i].fd, buffer, sizeof(buffer)-1);
				if (size > 0){ //读取成功
					buffer[size] = '\0';
					std::cout << "echo# " << buffer << std::endl;
				}
				else if (size == 0){ //对端连接关闭
					std::cout << "client quit" << std::endl;
					close(fds[i].fd);
					UnSetPollfds(fds, i); //将该文件描述符从fds数组中清除
				}
				else{
					std::cerr << "read error" << std::endl;
					close(fds[i].fd);
					UnSetPollfds(fds, i); //将该文件描述符从fds数组中清除
				}
			}
		}
	}
private:
	bool SetPollfds(struct pollfd fds[], int num, int fd)
	{
		for (int i = 0; i < num; i++){
			if (fds[i].fd == DFL_FD){ //该位置没有被使用
				fds[i].fd = fd;
				fds[i].events |= POLLIN; //添加读事件到events当中
				return true;
			}
		}
		return false; //fds数组已满
	}
	void UnSetPollfds(struct pollfd fds[], int pos)
	{
		fds[pos].fd = DFL_FD;
		fds[pos].events = 0;
		fds[pos].revents = 0;
	}
};

因为这里将fds数组的大小是固定设置的,因此在将新获取连接对应的文件描述符添加到fds数组时,可能会因为fds数组已满而添加失败,这时poll服务器只能将刚刚获取上来的连接对应的套接字进行关闭。

服务器测试😂

运行 poll 服务器时也需要先实例化出一个 PollServer 对象,对 poll 服务器进行初始化后就可以运行服务器了:

#include "poll_server.hpp"
#include <string>

static void Usage(std::string proc)
{
	std::cerr << "Usage: " << proc << " port" << std::endl;
}

int main(int argc, char* argv[])
{
	if (argc != 2){
		Usage(argv[0]);
		exit(1);
	}
	int port = atoi(argv[1]);
	PollServer* svr = new PollServer(port);
	svr->InitPollServer();
	svr->Run();
	
	return 0;
}

Linux 多路转接 —— poll_c++_06

  1. struct pollfd 结构当中包含了 events 和 revents,相当于将 select 的输入输出型参数进行分离,因此在每次调用 poll 之前,不需要像 select 一样重新对参数进行设置。
  2. poll可监控的文件描述符数量没有限制。
  3. poll也可以同时等待多个文件描述符,能够提高IO的效率。

说明一下:

虽然代码中将 fds 数组的元素个数定义为1024,但 fds 数组的大小是可以继续增大的,poll 函数能够帮你监视多少个文件描述符是由传入 poll 函数的第二个参数决定的。而 fd_set 类型只有1024个比特位,因此 select 函数最多只能监视1024个文件描述符。

Linux 多路转接 —— poll_网络_07

  1. 和 select 一样,当 poll 返回后,需要遍历 fds 数组来获取就绪的文件描述符。
  2. 每次调用 poll,都需要把大量的 struct pollfd 结构从用户态拷贝到内核态,这个开销也会随着 poll 监视的文件描述符数目的增多而增大。
  3. 同时每次调用 poll 都需要在内核遍历传递进来的所有fd,这个开销在 fd 很多时也很大。