随着车联网、智能家居、智慧城市等业务的发展,IoT进入了飞速发展期。由于要接入海量的硬件设备和传感器,且协议多样化,同时还要在极短的时间内处理大量的数据,所以对服务端的协议接入和处理能力要求极高。
1、海量长连接接入面临的挑战

当客户端的并发连接数达到数十万或者数百万时,系统一个较小的抖动就会导致很严重的后果,例如服务端的GC,导致应用暂停(STW)的GC持续几秒,就会导致海量的设备端设备掉线或者消息积压,一旦系统恢复,会有海量的设备接入或者海量的数据发送,很可能瞬间就把服务器冲垮。

IoT设备接入通常来说,有如下特点:

使用的网络主要是移动网络,网络质量不稳定,例如在一些偏远地区、丘陵地带等信号很差,网络容易闪断;
海量的端测设备接入,而且通常使用长连接,服务端的压力很大
不稳定,消息丢失,重复发送,延迟送达,过期发送时有发生
协议不统一,有各种私有协议,开发和测试成本较高

要想实现海量设备的接入,需要对操作系统相关参数、Netty框架、JVM GC参数,甚至业务代码针对性的优化,各种优化要素互相影响,设置或者组合不当就容易导致性能问题,这也是服务端实现海量设备接入的最大挑战。
2、操作系统参数调优

要实现百万级的长连接接入,首先需要对服务端的操作系统参数进行性能优化,如果保持出厂的默认设置,性能是无法满足业务需求。

1、文件描述符

设置系统最大文件句柄数
cat  /proc/sys/fs/file-max
//修改
在 /etc/sysctl.conf 插入 fs.file-max = 1000000
//配置生效
sysctl -p

设置单进程打开的最大句柄数

netty启动长链接 springboot netty长连接管理_长连接


2、TCP/IP相关参数

netty启动长链接 springboot netty长连接管理_线程池_02


netty启动长链接 springboot netty长连接管理_服务端_03

3、多网卡队列和软中断

netty启动长链接 springboot netty长连接管理_物联网_04


3、Netty性能调优

1、设置合理的线程数

boss线程池优化
对于Netty服务端,通常只需要启动一个监听端口用于端侧设备接入,但是如果集群实例较少,甚至是单机部署,那么在短时间内大量设备接入时,需要对服务端的监听方式和线程模型做优化,即服务端监听多个端口,利用主从Reactor线程模型。由于同时监听了多个端口,每个ServerSocketChannel都对应一个独立的Acceptor线程,这样就能并行处理,加速端侧设备的接人速度,减少端侧设备的连接超时失败率,提高单节点服务端的处理性能。

work线程池优化(I/O工作线程池)
对于I/O工作线程池的优化,可以先采用系统默认值(cpu内核数*2)进行性能测试,在性能测试过程中采集I/O线程的CPU占用大小,看是否存在瓶颈,具体策略如下:

netty启动长链接 springboot netty长连接管理_线程池_05

netty启动长链接 springboot netty长连接管理_线程池_06

2、心跳优化

netty启动长链接 springboot netty长连接管理_物联网_07

netty启动长链接 springboot netty长连接管理_线程池_08

netty启动长链接 springboot netty长连接管理_线程池_09

心跳检测周期通常不要超过60s,心跳检测超时通常为心跳检测周期的2倍

3、接收和发送缓冲区调优

netty启动长链接 springboot netty长连接管理_线程池_10

4、合理使用内存池

netty启动长链接 springboot netty长连接管理_长连接_11

netty启动长链接 springboot netty长连接管理_长连接_12

5、防止I/O线程被意外阻塞

通常情况下,我们是不能再Netty的I/O线程上做执行时间不可控的操作,例如访问数据库,调用第三方服务等。

netty启动长链接 springboot netty长连接管理_长连接_13

6、I/O线程与业务线程分离

netty启动长链接 springboot netty长连接管理_长连接_14

7、针对端测并发连接数的流控

无论服务端的性能优化到多少,都需要考虑流控功能,当资源成为瓶颈,或者遇到端侧设备的大量接入,

netty启动长链接 springboot netty长连接管理_物联网_15

4、JVM相关性能调优

netty启动长链接 springboot netty长连接管理_线程池_16

netty启动长链接 springboot netty长连接管理_物联网_17

netty启动长链接 springboot netty长连接管理_物联网_18

netty启动长链接 springboot netty长连接管理_服务端_19

netty启动长链接 springboot netty长连接管理_物联网_20

netty启动长链接 springboot netty长连接管理_线程池_21

netty启动长链接 springboot netty长连接管理_长连接_22

总结:以上这些调优,都属于小方法,小技巧,如果系统对性能要求很高,最优的还是采用分布式集群的方式来提升整个服务端的处理能力。