一位同事负责的一套MySQL数据库的CPU使用率达到100%,登上服务器top查看

Cpu(s):  95.9%us,  4.0%sy,  0.0%ni, 0.0%id,  20.0%wa,  0.0%hi,  0.0%si,  0.0%st

由于一直是在做Oracle的维护,对MySQL不熟悉,先在网上查了几篇文章,但好像都是一个人写的,不过从这些文章中也有了一个大体的处理思路。(由于不是我本人操作,没有记录详细的日志,这里只介绍下处理过程和使用到的命令,正文中的代码只是后期为说明加的。)

先使用root用户登上mysql,使用 show processlist命令查看当前哪些线程正在运行。查看下来一共有160多个

先简单说一下各列的含义和用途:

id    一个标识,你要kill一个语句的时候很有用。

user  显示当前用户,如果不是root,这个命令就只显示你权限范围内的sql句。

host  显示这个语句是从哪个ip 哪个端口上发出的。可以用来追踪出问题语句的用户。

db    显示这个进程目前连接的是哪个数据库。

command 显示当前连接的执行的命令,一般就是休眠(sleep),查询(query),连接(connect)。

time  此这个状态持续的时间,单位是秒。

state  显示使用当前连接的sql语句的状态,很重要的列。state只是语句执行中的某一个状态,以查询sql为例,可能需要经过copying to tmp table,Sorting result,Sending data等状态才可以完成。

info  显示这个sql语句,因为长度有限,所以长的sql语句就显示不全,但是一个判断问题语句的重要依据。

从show processlist命令输出的结果看到有一条sql语句重复出现,但是info列显示的不全只有select a.col1,a.col2,a.col3 from table1 a这样的信息。那就先从这个表入手查,select count(*) from table1;查出这张表有60W+的数据。select count(*) 使用了6秒。但是现在不确定这个语句执行的时候有没有where条件。

继续查资料,查到show processlist命令出的结果出处information_schema库下的processlist表。

可看到表porcesslist表的列跟show processlist输出的列是一致的。

再查询processlist表时发现info信息是完整的,在这里找到上边怀疑的sql的完整版为select a.col1,a.col2,a.col3 from table1 a where a.col4='123' and a.col5='abc';

查看这个语句的执行计划(类似下面这种)

可以看出语句没有使用索引而是使用全表扫描。分别对col4='123' 和col5='abc'做了统计,发现col4='123'的记录只有一条,而col5='abc'的记录有5W+条,很明显在col4上创建索引执行效率会高很多。查看表上是否有col4列上的索引(类似下面这种)。

发现col4列上没有索引,表的存储引擎为 InnoDB,于是在col4列上创建索引

再次查看执行计划,发现语句使用索引扫描。

sql语句的执行效率立马提升。CPU的使用率也降下来了。

这也还有一个疑问,oracle在创建索引时为了避免锁表引入了online创建索引。不知道mysql中如何在线创建索引?

mysql占用CPU93_mysql占用CPU93