作者:王航威 - fordba.com

 

MySQL 慢日志简介


MySQL慢日志(slow query log)想必大家都有听说,它是用来记录MySQL中的慢SQL(执行耗时超过 long_query_time 预设时间的SQL),并且扫描的行数超过min_examined_row_limit(如果也设置了这个选项的话),或者需要全表/全索引扫描的SQL(如果设置了 log_queries_not_using_indexes 选项的话,并不是指所有没使用索引的SQL),这些SQL效率通常较低,是可能影响MySQL的性能,DBA需要定期优化这些SQL。

在MySQL中,如果一个SQL需要长时间等待获取锁资源,那么这段获取锁的等待时间并不算执行时间,当SQL执行完成,释放相应的锁,才会记录到慢日志中,所以MySQL的慢日志中记录的顺序和实际的执行顺序可能不一样。

在默认情况下,MySQL的慢日志记录是关闭的,我们可以通过将设置slow_query_log=1来打开MySQL的慢查询日志,通过slow_query_log_file=file_name来设置慢查询的文件名,如果文件名没有设置,他的默认名字为 host_name-slow.log。同时,我们也可以设置 log-output={FILE|TABLE}来指定慢日志是写到文件还是数据库里面(如果设置log-output=NONE,将不进行慢日志记录,即使slow_query_log=1)。

默认地,MySQL的管理维护命令的慢SQL并不会被记录到MySQL慢日志中。常见的管理维护命令包括ALTER TABLE,ANALYZE TABLE, CHECK TABLE, CREATE INDEX, DROP INDEX, OPTIMIZE TABLE, 和REPAIR TABLE。如果希望MySQL的慢日志记录这类长时间执行的命令,可以设置log_slow_admin_statements = 1。

通过设置log_queries_not_using_indexes=1,MySQL的慢日志也能记录那些没使用索引的SQL(并不需要超过long_query_time,两者条件满足一个即可)。但打开该选项的时候,如果你的数据库中存在大量没有使用索引的SQL,那么MySQL慢日志的记录量将非常大,所以通常还需要设置参数log_throttle_queries_not_using_indexes 。默认情况下,该参数为0,表示不限制,当设置改参数为大于0的值的时候,表示MySQL在一分钟内记录的没使用索引的SQL的数量,来避免慢日志记录过多的该类SQL。

在MySQL 5.7.2 之后,如果设置了慢日志是写到文件里,需要设置log_timestamps 来控制写入到慢日志文件里面的时区(该参数同时影响general日志和err日志),不设置的话,log文件中的记录采用UTC时间,而非本地时间。如果设置慢日志是写入到数据库中,该参数将不产生作用。

所以,总结下哪些SQL能被MySQL慢日志记录:

  • 不会记录MySQL中的管理维护命令,除非明确设置log_slow_admin_statements=1;

  • SQL执行时间必须超过long_query_time,(不包括锁等待时间)

  • 参数log_queries_not_using_indexes设置为1,且SQL没有用到索引,同时没有超过log_throttle_queries_not_using_indexes 参数的设定。

  • 查询examine的行数必须超过min_examined_row_limit

注1:如果表没有数据或者只有1条数据,优化器觉得即便走索引对效率并没帮助,哪怕 log_queries_not_using_indexes=1 也不会记录到慢日志中。

注2:如果SQL在QC命中了,也不会记录到慢日志中。

注3:修改密码之类的维护操作,密码部分将会被星号代替,避免明文显示。

Anemometer 简介


项目地址:https://github.com/box/Anemometer

演示地址:http://lab.fordba.com/anemometer/

Anemometer 是一个图形化显示从MySQL慢日志的工具。结合pt-query-digest,Anemometer可以很轻松的帮你去分析慢查询日志,让你很容易就能找到哪些SQL需要优化。

如果你想要使用Anemometer这个工具,那么你需要准备以下环境:

  1. 一个用来存储分析数据的MySQL数据库

  2. pt-query-digest.                       (doc: Percona Toolkit )

  3. MySQL数据库的慢查询日志 (doc: The Slow Query Log )

  4.  PHP版本为 5.5+,apache或者nginx等web服务器均可。

 

安装


  • 下载Anemometer

 git clone git://github.com/box/Anemometer.git anemometer

 

载入数据


首先创建表结构,将global_query_review 以及global_query_review_history 创建出来。由于表定义中存在0000-00-00 00:00:00 的日期默认值,需要修改sql_mode,将其zero_date的sql_mode 关闭,同时关闭only_full_group_by

cd /www/lab/anemometer
mysql -f < ./install.sql 

现在需要使用pt-query-digest 抓取MySQL的慢查询日志,然后将数据插入到slow_query_log 数据库的相应表中。

使用如下方式载入数据,h表示主机名或者ip地址,D表示database,t表示表名,再最后面跟上慢日志路径。

如果 pt-query-digest version > 2.2:

 $ pt-query-digest --user=anemometer --password=superSecurePass \
                  --review h=127.0.0.1,D=slow_query_log,t=global_query_review \
                  --review-history h=127.0.0.1,D=slow_query_log,t=global_query_review_history \
                  --no-report --limit=0% \ 
                  --filter=" \$event->{Bytes} = length(\$event->{arg}) and \$event->{hostname}=\"$HOSTNAME\"" \ 
                  /data/mysql/slow-query.log

如果 pt-query-digest version <= 2.2

$  pt-query-digest --user=root --password=root  --review h=127.0.0.1,D=slow_query_log,t=global_query_review --history h=127.0.0.1,D=slow_query_log,t=global_query_review_history  --no-report --limit=0%  --filter=" \$event->{Bytes} = length(\$event->{arg}) and \$event->{hostname}=\"$HOSTNAME\""  /data/mysql/slow-query.logPipeline process 11 (aggregate fingerprint) caused an error: Argument "57A" isn't numeric in numeric gt (>) at (eval 40) line 6, <>; line 27.
Pipeline process 11 (aggregate fingerprint) caused an error: Argument "57B" isn't numeric in numeric gt (>) at (eval 40) line 6, <> line 28.Pipeline process 11 (aggregate fingerprint) caused an error: Argument "57C" isn't numeric in numeric gt (>) at (eval 40) line 6, <> line 29.

如果你看到一些报错如上面例子所示,脚本并没有出现问题,他只是输出当前的操作。

配置Anemometer


修改Anemometer配置文件

$ cd anemometer/conf
$ cp sample.config.inc.php config.inc.php 

示例的配置文件中,你需要进行部分修改,用来连接数据库获取慢查询的分析数据。
修改 datasource_localhost.inc.php 文件中的配置,主要为主机

$conf['datasources']['localhost'] = array(
    'host'  => '127.0.0.1',
    'port'  => 3306,
    'db'    => 'slow_query_log',
    'user'  => 'root',
    'password' => 'root',
    'tables' => array(
        'global_query_review' => 'fact',
        'global_query_review_history' => 'dimension'
    ),
        'source_type' => 'slow_query_log');

然后访问127.0.0.1/anemometer 的时候出现

Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'slow_query_log.dimension.sample' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by (1055)

需要将sql_mode 中only_full_group_by 关闭。

如果你想利用Anemometer 的explain功能来获取执行计划,修改配置文件的以下部分。

$conf['plugins'] = array(
     'visual_explain' => '/usr/local/bin/pt-visual-explain',  --这里需要修改为正确的路径
        ...
    'explain'       =>      function ($sample) {
        $conn['user'] = 'anemometer';
        $conn['password'] = 'superSecurePass';

        return $conn;
    },);

 

结果展示


在5.7中,默认SQL_MODE是启用ONLY_FULL_GROUP_BY的,需要将其关闭,否则Anemometer将报错。

选择相应的列,然后点击search,就可以显示结果

sql执行计划查看以及历史


当我们选择一个sql的hash值的时候,能看到他的一个具体的执行计划,同时也能看到匹配该sql的历史sql,消耗,表的统计信息,建表语句等。
MySQL慢日志简介及Anemometer工具介绍 | | For DBA_慢查询

同时也能针对sql进行评论,为sql优化提交建议等。

创建自动收集慢日志脚本

在anemometer下面的script文件中有个收集脚本,可以通过crontab进行定时收集慢日志,语法如下:

Usage: ./scripts/anemometer_collect.sh --interval 

Options:
    --socket -S              The mysql socket to use
    --defaults-file          The defaults file to use for the client
    --interval -i            The collection duration
    --rate                   Set log_slow_rate_limit (For Percona MySQL Only)

    --history-db-host        Hostname of anemometer database server
    --history-db-port        Port of anemometer database server
    --history-db-name        Database name of anemometer database server (Default slow_query_log)
    --history-defaults-file  Defaults file to pass to pt-query-digest for connecting to the remote anemometer database

示例脚本:

cd anemometer 
mkdir etc
cd etc
vi anemometer.local.cnf   --这里创建配置文件,添加用户名密码[client]user=anemometer_local
password=superSecurePass./scripts/anemometer_collect.sh --interval 30 --history-db-host=127.0.0.1

 

叶师傅补充

我以前的Anemometer玩法是这样的。

  • 把多个主机的slow log汇聚到一起,调用pt-query-digest解析并写入db,方便slow log的统一管理、解析、展示,而不是每个实例都单独部署一套;

  • 每个主机上可能会跑多实例,其slow log的文件命名,会至少体现IP、端口、业务名,比如:slowquery-192.168.0.1:3306-yejr.log;

  • 调用pt-query-digest解析时,传递给 hostname 参数的值为 "192.168.0.1:3306",这样一来,每个实例都可以被单独处理列出,更加直观;

  • 通常,每个实例都有统一的监控账号,Anemometer可以利用这个账号来连接远程实例,查看解析SQL执行计划。

 

您可能感兴趣的文章:

  • FAQ系列 | slow log中出现commit、binlog dump等奇怪的记录

  • 是谁,把InnoDB表上的DML搞慢的?

  • FAQ系列 | 提问的正确姿势