MySQL server during query的远程连接错误

 

内容提要:在glibc某些版本中,gethostbyaddr函数(确切地说是_nss_dns_gethostbyaddr_r)存在缓冲区溢出问题,在处理大数据时会造成SEGMENT FAULT……
  Mysql的远程连接出现"Lost connection to MySQL server during query" 安装完了RH 8.0用自带的mysql以后直接在本机上可以正常使用mysql登陆,用

  mysql -u root -p
  添加了一些用户,如* beginner pass

  即beginner可以从任何地方通过密码可以访问这台Mysql服务器(假设我的mysql服务器为mysql.test.com)但当我运行

  mysql -h mysql.test.com -u beginner -p
  就提示:

  ERROR 2013: Lost connection to MySQL server during query
  其实我只要输入

  mysql -h mysql.test.com时就出现上面的提示,也就是说它根本还没有到验证密码那一步。

  这个问题是由于glibc的一个bug造成的。

  在glibc某些版本中,gethostbyaddr函数(确切地说是_nss_dns_gethostbyaddr_r)存在缓冲区溢出问题,在处理大数据时会造成SEGMENT FAULT。

  在处理远程连接时,mysqld会调用ip_to_hostname()函数,再由这个函数调用gethostbyaddr函数,最后系统在执行nss_dns_gethostbyaddr_r函数处崩溃。因此,会出现上述情况。解决问题的办法是升级glibc。

 

 

 

问题描述:在使用 mysql 的过程中发现,偶尔的查询或一段时间内的登录会失败,返回的错误提示信息为:Lost Connection During Query。

 

问题定位:这个问题在半年、甚至一年前都遇到过,由于它不是必现,往往你去看的时候没法重现,并且一个 mysql server 管理好多个数据库,查询又不是时刻发生的,常常不知所措。无法登录时,更是束手无策。

    最初,比较粗暴的方法是重启 mysql,问题在一段时间内能缓解。

    后来,使用 flush tables 也能在一段时间内缓解。

    再后来,通过查看 mysql 的错误日志,发现一共有三种提示信息:

        第一种:080724 19:55:05 [ERROR] Error in accept: Too many open files,这种明显是由于 mysql 打开文件个数过多,mysql 无法再“接收”新的连接进来,也就是没有办法登录,造成连接失败。

        第二种:080724 19:45:11 [ERROR] /usr/local/mysql/bin/mysqld: Sort aborted,这种是放弃了排序,但没有说明原因。

        第三种:080725 9:30:33 [ERROR] /usr/local/mysql/bin/mysqld: Can't open file: 'OperateRecord.MRG' (errno: 24),这种是打开文件失败,错误码是24,通过 perror 查询详细的错误原因是:OS error code 24: Too many open files,也是打开文件过多。再通过 status 查看 mysql 的打开文件个数,此时一般都接近 1000 个。再通过 show variables 查看 mysql 的配置,默认其打开文件个数为 open_files_limit 为 2048,按道理说这个大小是足够的。

 

问题解决:

    原来 mysql 中的 open_files_limit 只是限制 mysql 这个进程打开的最大文件个数。而内核也会对 mysql 打开的进程数进行限制,并且优先级要高。通过 ulimit -a 查看 mysql 这个用户的最大打开文件个数,发现其值为 1024(linux 默认都是1024)。

    原来,mysql 已经打开了近 1000 个表,若再打开一个 merge 表(包含100个子表),导致文件句柄过多而失败。通过修改 /etc/security/limits.conf 配置文件,添加如下行:*                -       nofile          4096,把该限制放大,重新启动 mysql ,问题得到彻底解决。

    设置 mysql 打开文件限制方法:把 set-variable=open_files_limit=10240 加到配置文件中。