MySQL执行计划分析

Ⅰ、认识执行计划的每个字段

(root@localhost) [(none)]> desc select 1;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra          |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
|  1 | SIMPLE      | NULL  | NULL       | NULL | NULL          | NULL | NULL    | NULL | NULL |     NULL | No tables used |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
1 row in set, 1 warning (0.00 sec)

1.1 id

  • 单纯的join,id都是1,且从上到下

  • subquery、scala subquery都会使id递增

     

1.2 select type

  • simple

    • 不使用union或者subquery的简单query

    • 子查询被优化器打开,失效了

  • primary

    • 使用union结合select时,第一个select type

    • subquery的query

  • union

    • 使用union结合select除了第一个select type为primary,其余为union(extra中union result是union去掉重复值的临时表)

    • 5.7开始union all不会出现union result,因为不去重

  • subquery

    • 不是用在from后面的subquery

    • 和外部表无关联

    • subquery(标量子查询)执行计划没错误,不代表sql执行没错(不能超过1行数据,subquery return more than 1 row)

  • dependent subquery

    • 必须依附于外面的值

    • scala subquery(和外部有关系的标量子查询)

    • exists

  • derived

    • unin/union all

    • group by

    • distinct

    • 聚合函数

    • limit

    • @

    • from位置之后的subquery

    • derived是生成在内存或者临时表空间中

    • 如果derived作驱动表时,要点是减少数据量

    • 当作被驱动表时产生auto_key索引,也是以减少数据量为目

    • 5.7中optimizer_switch='derived_merge=on'可以把简单subquery打开成join

    • derived_merge为on时被驱动表的连接条件要有索引,为off时被驱动表结果集要小

    • 5.7的derived_merge可能导致子查询中order by失效

    • 5.7以下操作可以防止derived_merge

  • materialized

    • select /*+ semijoin(@sub MATERIALIZATION) / * from t_order t2 where t2.emp_no in (select /+ QB_NAME(sub) */ t1.emp_no from dept_emp t1);

    • 物化,5.7开始in会产生,也会生成auto_key索引

    • in中使用hint QB_NAME,外层使用这个hint

       

1.3 table

  • NULL

    • 表示不使用任何表

    • 使用dual

    • extra中出现select tables optimized away,多见于count操作

  • 表名或者表的别名

  • <derived+ id><union + id>

    • 临时表<>里的数字是id列

    • tmp_table_size = max_heap_table_size适当调大

1.4 type

  • const

    • 使用primary key或者unique key取得一条数据

  • eq_ref

    • join,且满足被驱动表的连接条件unique key或者primary key

  • ref

    • 对索引列做等号判断

  • range

    • between in like > <

    • 和const的区别在于索引扫描范围不一样

  • index

    • 索引全扫描,比扫全表且order by的情况快,但是绝大部分情况下也是优化对象

    • 不能使用range,const,ref的情况下,且只查询索引列,即不回表,使用索引进行排序或者聚合即省略排序

    • 索引(a,b),select a from xxx where b = ''; 即联合索引中前导列不在where条件中,且查询列在索引中

    • 在聚合运算中group by后面的列在索引或者primary key中,且查询列也在索引中

  • all

    • 无索引

    • 对索引列加工

    • 索引列隐式类型转换

    • 对日期类型进行like '20xxx'

    • 单列索引,对数字列进行like '30%'

    • 全表扫描

    • 大表中查询超过一半以上的值,效果更好

    • 索引失效

       

1.5 possible_keys

  • 列出可能用到的索引,对优化没什么帮助

  • 5.6之后开始支持auto_key

  • auto_key就是临时创建索引,需要消耗一些内存和cpu,对tmp_table_size,max_heap_table_size依赖较大

  • mysql列大小超过767个字节,无法生成auto_key

  • convert(xxx,数据类型,字符集)

1.6 key

  • sql用到的索引

     

1.7 key_len

  • 显示sql到底使用了多少索引

     

1.8 ref

  • 只有type是ref或者const才会出现内容,没啥用,不用管

     

1.9 rows

  • MySQL优化器根据统计信息预估出来的值,不一定准

     

1.10 filter

  • 和rows一样是预估值,非100的情况是extra有using where关键字,表示从存储引擎中拿到数据后再加工的比例

  • 5.7开始该值比较准确

     

1.11 Extra

  • Distinct

    • MySQL在join过程中取出一行之后查询另一个表时,碰到一行就停止,有点像exsits

    • 必须是join

    • distinct关键字

    • select列上只能含有驱动表的字段

    • 使用straight_join hint可以强制改变驱动表

  • select tables optimized away

    • 查询中只有min、max的时候出现,有时候count貌似也会出现

    • 联合主键,其中任一一个字段用等值查询,查出另一个字段的min或max,且不能包含group by

  • Using filesort

    • order by, group by且没使用索引

    • 8.0 group by不会出现

  • Using index

    • 只使用索引不回表就可以查到

    • 如果表对应的where条件选择率不是很好,且一行长度很长,此时课考虑创建包含对应列的索引达到减少物理io的目的

    • 延迟join必须使用using index,否则无效

  • Using temporary

    • sql执行过程中存储中间结果会使用tempoary table,但无法判断在内存还是disk

    • order by,group by未使用索引

    • 执行计划中的select type为derived

    • show swssion status like '%tmp%'

    • max_heap_table_size和tmp_table_size(不一致时以小的为准)

  • Using where

    • 一般和filtered,rows一起看

    • 表示从存储引擎中拿到数据再过滤

    • rows是存储引擎中拿数据的预估值,filtered是再过滤的百分比

  • Using index condition

    • 必须是二级索引才有,且有索引后面部分无法使用时,回表次数很大,效果更好

    • optimizer_switch='index_condition_pushdown=on'

  • Using MRR

    • optimizer_switdch='mrr_cost_based=0ff'

    • 回表之前先排序,降低随机io

  • Range checked for each record

    • type为all

    • 这是优化对象,紧接着用show warnings来定位问题

  • Using join buffer(Block Nested Loop)

    • optimizer_switch='block_nested_loop=on,batched_key_access=on'

    • 被驱动表没有索引且数据量较少的时候,一般这种情况也是优化对象

 

Ⅱ、获取运行中SQL的执行计划

desc for connection connection_id;