netty的http1服务器在运行一段时间后会无法提供服务,返回客户端socket hang up
使用apipost测试抓包显示三次握手后被reset,经查是连接数过多

ps:客户端使用了大量短连接,如果能改成长连接就会消耗更少的连接,但是客户端逻辑无法掌控,只能修改服务器。
另外能保证客户端完成四次挥手也可以避免,但同样客户端逻辑无法掌控。

修改连接数限制

限制取决于代码中option(ChannelOption.SO_BACKLOG) 和/proc/sys/net/core/somaxconn的最小值。
登录容器,cat /proc/sys/net/core/somaxconn显示128,对于一个服务器来说,这个限制太小了,可以放大。
但是k8s把容器的参数分类了,大部分的参数都属于unsafe,不能直接修改。

第一步:修改kubelet启动参数

kubelet启动增加参数:kubelet --allowed-unsafe-sysctls ‘net.core.somaxconn’

kubelet可能是通过配置文件启动的,比如/etc/systemd/system/kubelet.service.d/10-kubeadm.conf

修改后重启kubelet:systemctl restart kubelet

确认是否生效:

zabbix_agentd 连接k8s上的zabbix_server k8s tcp连接数_容器

第二步:修改netty的yaml

在Deployment中spec-template-spec-containers下增加securityContext:

securityContext:
         sysctls:
            - name: net.core.somaxconn
              value: "1024"

启动pod后查看somaxconn:

zabbix_agentd 连接k8s上的zabbix_server k8s tcp连接数_容器_02

根据连接状态优化

根据连接状态,如果是TIME_WAIT则修改TIME_WAIT等待时间((主动关闭的一方是TIME_WAIT,被动关闭一方是CLOSE_WAIT),如果是ESTABLISHED且大部分是闲置不用的连接则增加闲置关闭逻辑。

cat /proc/net/tcp查看到tcp连接数非常多,连接状态01表示已连接,0A表示监听中,6表示TIME_WAIT

zabbix_agentd 连接k8s上的zabbix_server k8s tcp连接数_tcp/ip_03

tcp状态值说明:

TCP_ESTABLISHED:1   TCP_SYN_SENT:2    TCP_SYN_RECV:3      TCP_FIN_WAIT1:4
TCP_FIN_WAIT2:5     TCP_TIME_WAIT:6  TCP_CLOSE:7         TCP_CLOSE_WAIT:8
TCP_LAST_ACL:9      TCP_LISTEN:10  TCP_CLOSING:11

修改 TIME_WAIT 连接数量

需要修改关闭连接的等待时间,这也是k8s的unsafe参数

步骤一 修改kubelet配置,增加:

--allowed-unsafe-sysctls net.core.somaxconn,net.ipv4.*

步骤二 修改deployment:

securityContext:
    sysctls:
       - name: net.core.somaxconn                               
         value: "1024"
       - name: net.ipv4.tcp_fin_timeout
         value: "30"

增加TCP空闲关闭逻辑

HTTP/1.1应该由客户端关闭连接,尤其是在keep-live情况下。
但是客户端可能没有没有执行四次挥手就关闭了(没有发送FIN),这时服务端就一直认为是ESTABLISHED,需要增加空闲关闭逻辑,即一个链接上一段时间内没有收到报文也没有发送报文就关闭。

public void initChannel(SocketChannel ch) {
        ChannelPipeline p = ch.pipeline();        
        //闲置10分钟关闭连接 
        p.addLast(new IdleStateHandler(0, 0, 600, TimeUnit.SECONDS));
        p.addLast(new IdleEventHandler());
        p.addLast...//正常报文处理
    }
    
    public static class IdleEventHandler extends ChannelDuplexHandler {
        @Override
        public void userEventTriggered(ChannelHandlerContext ctx, Object paramObject) throws Exception {
            if (paramObject instanceof IdleStateEvent) {
                IdleState state = ((IdleStateEvent) paramObject).state();
                if (state == IdleState.ALL_IDLE) {
                    //关闭连接
                    logger.info(ctx.channel().remoteAddress() + "idel to close!");
                    ctx.channel().close();
                }
            } else {
                super.userEventTriggered(ctx, paramObject);
            }
        }
    }