故障描述:

redis服务器连不上,应用程序报错获取不到连接,内存勾兑和状态报告程序都会出问题

故障分析:

redis服务器默认设置的最大连接数maxclients是10000,但是受服务器最大文件数影响,服务器默认最大文件数是1024,所以redis最大连接也为1024-32=992,由于网络原因或连接未正常关闭导致redis服务器连接数接近990左右,应用程序连不上redis。

故障处理:

修改服务器最大文件数vi/etc/scurity/limits.conf添加*softnofile65536*hardnofile65536设置最大文件数65536,内核参数对文件描述符也有限制,如果设置的值大于内核的限制,也是不行的,需设置vi/etc/sysctl.conffs.file-max=65535,sysctl-p生效,设置好用ulimit-a可以看到openfiles为65535,但是用catproc/pid/limits查看redis的进程对应的maxopenfiles依然为992,原因是centos6.2版本以下,已经运行的进程是无法修改limits的,但是centos6.2以上可以通过echo-n‘Maxopenfiles=65535:65535’>/proc/pid/limits命令,动态设置redis进程的最大连接数;正常情况下已经关闭客户端但没释放的ESTABLISHEDoff连接是清理不掉的,只能杀掉对应redis端口,数据会丢失,但是redis有封装好的方法CLIENT命令,能够实现三种功能:检查连接的状态,杀掉某个连接以及为连接设置名字三种功能,CLIENTLIST命令能够获取当前所有客户端的状态,CLIENTKILL命令来杀死指定的连接了,所以可以通过CLIENTKILL来杀掉没用但无法释放的tcp连接,处理掉redis连接数过多无法连接的问题。