一、慢查询原因
要对慢查询进行优化,首先要搞清楚慢查询的原因,原因主要有三:
(1)加载了不需要的数据列
(2)查询条件没有命中索引
(3)数据量太大
二、优化方案
优化也是针对这三个方向的:
(1)先分析语句,看看是否加载了额外的数据,可能是查询了多余的行并且抛弃掉了,可能是加载了许多结果中并不需要的列,如果有这些问题,则对语句进行分析、重写
(2)分析语句的执行计划,获得其使用索引的情况,然后修改语句或修改索引,使得语句尽可能地命中索引
(3)如果对语句的优化都已经无法进行了,可以考虑是否是表中数据量太大引起的慢查询,如果是,则可以进行横向或者纵向分表
三、补充-执行计划
1、MySQL的执行计划怎么看
(1)最简单的做法是,使用可视化工具Navicat,执行查询时打开【解释】
(2)具体的含义
执行计划字段对照表 | ||
序号 | 字段 | 作用 |
1 | id | id是一个有顺序的编号,是查询的顺序号 (1)id的顺序按select出现的顺序增长,有几个select就显示几行,就有几个id。 (2)id列的值越大执行的优先级越高越先执行,id列的值相同则从上往下执行,id列的值为NULL最后执行 |
2 | select_type | 表示查询中每个select子句的类型 (1)SIMPLE: 表示此查询不包含 UNION 查询或子查询 |
3 | table | 表示该语句查询的表 |
4 | partitions | |
5 | type | 是优化SQL的重要字段,判断SQL性能和优化程度的重要指标。 type的取值类型范围: (1)const:通过索引一次命中,匹配一行数据 (2)system:表中只有一行记录,相当于系统表 (3)eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配 (4)ref:非唯一性索引扫描,返回匹配某个值的所有 (5)range:只检索给定范围的行,使用一个索引来选择行,一般用于:between,<,> (6)index:只遍历索引树 (7)ALL:表示全表扫描,这个类型的查询是性能最差的查询之一。随着表的数量增多,执行效率变慢 *(8)执行效率: |
6 | possible_keys | 表示Mysql在执行该sql语句的时候,可能用到的索引信息,仅仅是可能,实际不一会用到。很多时候索引不一定会命中。 |
7 | key | 此字段是 mysql 在当前查询时所真正使用到的索引。 key是possible_keys的子集 |
8 | key_len | 表示查询优化器使用了索引的字节数,这个字段可以评估组合索引是否完全被使用,这也是我们优化sql时,评估索引的重要指标。 |
9 | ref | |
10 | rows | mysql 查询优化器根据统计信息,估算该sql返回结果集需要扫描读取的行数,这个值相关重要,索引优化之后,扫描读取的行数越多,说明索引设置不对,或者字段传入的类型之类的问题,说明要优化空间越大 |
11 | filtered | 返回结果的行占需要读到的行(rows列的值)的百分比,就是百分比越高,说明需要查询到数据越准确, 百分比越小,说明查询到的数据量大,而结果集 |
12 | extra | (1)using filesort :表示 mysql 对结果集进行外部排序,不能通过索引顺序达到排序效果。一般有using filesort都建议优化去掉,因为这样的查询 cpu 资源消耗大,延时大。 (2)using index:覆盖索引扫描,表示查询在索引树中就可查找所需数据,不用扫描表数据文件,往往说明性能不错。 (3)using temporary:查询有使用临时表, 一般出现于排序, 分组和多表 join 的情况, 查询效率不高,建议优化。 (4)using where :sql使用了where过滤,效率较高。 |
对1的一个例子:有多少个select就有多少行,就有多少id
注:执行计划就是SQL的执行查询的顺序。
2、SQL语句的执行顺序
SQL语句的执行顺序是区别于,SQL的执行查询的顺序的,这感觉有点咬字眼了。
但是一般说的SQL语句的执行顺序是指:
SELECT * FROM `student` 这么一个select查询语句的执行顺序,这里是先from然后才是select。
如果有where等其他关键字:
select 语句的执行顺序
1 | from |
2 | join |
3 | on |
4 | where |
5 | group by |
6 | count、sum等统计函数 |
7 | having |
8 | select |
9 | distinct |
10 | order by |
11 | limit |
3、关于索引没有命中的一种猜想
如果创建了索引,特别是组合索引,却没有命中,那么优先要考虑创建的索引有没有符合最左前缀原则。
(1)最左前缀原则:顾名思义是最左优先,以最左边的为起点任何连续的索引都能匹配上。
1)如果第一个字段是范围查询需要单独建一个索引;
2)在创建多列索引时,要根据业务需求,where子句中使用最频繁的一列放在最左边;
当创建(a,b,c)复合索引时,想要索引生效的话,只能使用 a和ab、ac和abc三种组合。
(2)一个例子:
为student表创建一个组合索引 age_name_sex_index
在执行计划中可以看到,索引命中了,这时where 了 age字段
但是如果没有where了age字段,那么索引就不会命中