不知道你是否还记得异常连接—— accept 返回前连接终止。这篇文章探讨的是在 accept 函数调用前,连接被异常终止的情况。

不过,很遗憾我们并未观察到 accept 产生异常。man 手册中解释,linux 会把错误转移到 accept 返回的新套接字(已连接套接字)中,因此在后续的 read 已连接套接字的时候,会产生错误。

假设我考虑最坏的情况,即 accept 会产生错误,会怎样呢?

1. 容易产生错误的代码

while(1) {
rfds = {listenfd, ...}
select(maxfd + 1, &rfds, ...);
if (listenfd in rfds) {
// 可能会阻塞
accept(listenfd, ...);
}
}

有些系统的实现中,如果在 select 返回后,accept 调用前,连接异常终止,内核会把该连接从已连接队列中删除,并释放相应的已连接套接字。如此一来,就好像连接从未发生过一样,这时候调用 accept 就可能会阻塞。

另外有些系统会让 accept 直接返回一个 ECONNABORTED 错误或 EPROTO 错误。

虽然在 Linux 中并不会出现这种情况……

2. 使用非阻塞 accept

为了防止 accept 被阻塞,应该使用非阻塞 i/o. 这样就可以捕捉到 EWOULDBLOCK 错误,让程序继续下去。

// 设置 listenfd 为非阻塞套接字。
setNonblock(listefd, 1);
while(1) {
rfds = {listenfd, ...}
select(maxfd + 1, &rfds, ...);
if (listenfd in rfds) {
ret = accept(listenfd, ...);
if (ret < 0) {
// 如果是 EWOULDBLOCK 则继续循环
if (errno == EWOULDBLOCK) continue;
ERR_EXIT("accept");
}
}
}

3. 总结

  • 知道 accept 返回前连接异常终止该如何处理