1. 什么是执行计划
使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。
2. 执行计划的作用
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
3. 执行计划详解
通过EXPLAIN关键分析的结果由以下列组成,接下来挨个分析每一个列
3.1 ID列
ID列:描述select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
根据ID的数值结果可以分成一下三种情况
- id相同:执行顺序由上至下
- id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- id相同不同:同时存在
id如果相同,可以认为是一组,从上往下顺序执行;
在所有组中,id值越大,优先级越高,越先执行
3.2 select_type列
表 a1,a2,a3结构是一样的
3.2.1 SIMPLE
简单的 select 查询,查询中不包含子查询或者UNION
EXPLAIN
SELECT * FROM a1;
3.2.2 PRIMARY与SUBQUERY
PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为
SUBQUERY:在SELECT或WHERE列表中包含了子查询
EXPLAIN
SELECT * FROM a1 WHERE id = (SELECT id FROM a2 WHERE id = 1);
3.2.3 DERIVED
在FROM列表中包含的子查询被标记为DERIVED(衍生)
MySQL会递归执行这些子查询, 把结果放在临时表里。
EXPLAIN
SELECT * FROM a1 a,(SELECT id FROM a2 WHERE id = 1) b WHERE a.id = b.id;
3.2.4 UNION RESULT 与UNION
UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;
UNION RESULT:从UNION表获取结果的SELECT
EXPLAIN
SELECT * FROM a2 UNION SELECT * FROM a3;
3.3 table列
显示这一行的数据是关于哪张表的
3.4 Type列
type显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
需要记忆的
system>const>eq_ref>ref>range>index>ALL
一般来说,得保证查询至少达到range级别,最好能达到ref。
3.4.1 System与const
System:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计
Const:表示通过索引一次就找到了
const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快
如将主键置于where列表中,MySQL就能将该查询转换为一个常量
EXPLAIN
SELECT * FROM a1 a,(SELECT id FROM a2 WHERE id = 1) b WHERE a.id = b.id;
注意的是 SELECT id FROM a2 WHERE id = 1 可以作为一个临时表,里面只是存放了一条记录;
3.4.2 eq_ref
唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
EXPLAIN SELECT * FROM a1 a,a2 b WHERE a.id = b.id
3.4.3 Ref
非唯一性索引扫描,返回匹配某个单独值的所有行.
本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体
EXPLAIN
SELECT * FROM a2 WHERE NAME = '张三'
3.4.4 Range
只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引
一般就是在你的where语句中出现了between、<、>、in等的查询
这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
3.4.5 Index
当查询的结果全为索引列的时候,虽然也是全部扫描,但是只查询的索引库,而没有去查询
数据。
EXPLAIN
SELECT id FROM a2
但是我们需要注意的是,要是下面的sql,就不是index了
EXPLAIN
SELECT id FROM a2 WHERE NAME = '张三'
3.5 possible_keys 与Key
possible_keys:可能使用的key
Key:实际使用的索引。如果为NULL,则没有使用索引
查询中若使用了覆盖索引,则该索引和查询的select字段重叠
这里的覆盖索引非常重要,后面会单独的来讲
3.6 key_len
Key_len表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。
key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
* key_len表示索引使用的字节数,
* 根据这个值,就可以判断索引使用情况,特别是在组合索引的时候,判断所有的索引字段是否都被查询用到。
* char和varchar跟字符编码也有密切的联系,
* latin1占用1个字节,gbk占用2个字节,utf8占用3个字节。(不同字符编码占用的存储空间不同)
3.6.1 字符类型
3.6.1.1 字符类型-索引字段为char类型+不可为Null时
name这一列为char(10),字符集为utf-8占用3个字节
Keylen=10*3
3.6.1.2 字符类型-索引字段为char类型+不可为Null时
name这一列为char(10),字符集为utf-8占用3个字节,外加需要存入一个null值
Keylen=10*3+1(null) 结果为31
3.6.1.3 索引字段为varchar类型+不可为Null时
Keylen=varchar(n)变长字段+不允许Null=n*(utf8=3,gbk=2,latin1=1)+2
3.6.1.4 索引字段为varchar类型+允许为Null时
Keylen=varchar(n)变长字段+允许Null=n*(utf8=3,gbk=2,latin1=1)+1(NULL)+2
3.6.2 数值类型
CREATE TABLE `numberKeyLen ` (
`c0` int(255) NOT NULL ,
`c1` tinyint(255) NULL DEFAULT NULL ,
`c2` smallint(255) NULL DEFAULT NULL ,
`c3` mediumint(255) NULL DEFAULT NULL ,
`c4` int(255) NULL DEFAULT NULL ,
`c5` bigint(255) NULL DEFAULT NULL ,
`c6` float(255,0) NULL DEFAULT NULL ,
`c7` double(255,0) NULL DEFAULT NULL ,
PRIMARY KEY (`c0`),
INDEX `index_tinyint` (`c1`) USING BTREE ,
INDEX `index_smallint` (`c2`) USING BTREE ,
INDEX `index_mediumint` (`c3`) USING BTREE ,
INDEX `index_int` (`c4`) USING BTREE ,
INDEX `index_bigint` (`c5`) USING BTREE ,
INDEX `index_float` (`c6`) USING BTREE ,
INDEX `index_double` (`c7`) USING BTREE
)
ENGINE=InnoDB
DEFAULT CHARACTER SET=utf8 COLLATE=utf8_general_ci
ROW_FORMAT=COMPACT;
EXPLAIN
select * from numberKeyLen where c1=1;
EXPLAIN
select * from numberKeyLen where c2=1;
EXPLAIN
select * from numberKeyLen where c3=1;
EXPLAIN
select * from numberKeyLen where c4=1;
EXPLAIN
select * from numberKeyLen where c5=1;
EXPLAIN
select * from numberKeyLen where c6=1;
EXPLAIN
select * from numberKeyLen where c7=1;
3.6.3 日期和时间
3.6.4 总结:
¥ 字符类型
变长字段需要额外的2个字节(VARCHAR值保存时只保存需要的字符数,另加一个字节来记录长度(如果列声明的长度超过255,则使用两个字节),所以VARCAHR索引长度计算时候要加2),固定长度字段不需要额外的字节。
而NULL都需要1个字节的额外空间,所以索引字段最好不要为NULL,因为NULL让统计更加复杂并且需要额外的存储空间。
复合索引有最左前缀的特性,如果复合索引能全部使用上,则是复合索引字段的索引长度之和,这也可以用来判定复合索引是否部分使用,还是全部使用。
¥ 整数/浮点数/时间类型的索引长度
NOT NULL=字段本身的字段长度
NULL=字段本身的字段长度+1(因为需要有是否为空的标记,这个标记需要占用1个字节)
datetime类型在5.6中字段长度是5个字节,datetime类型在5.5中字段长度是8个字节
3.7 ref
显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值
3.8 Extra
包含不适合在其他列中显示但十分重要的额外信息。
当发现有Using filesort 后,实际上就是发现了可以优化的地方
尤其发现在执行计划里面有using filesort而且还有Using temporary的时候,特别需要注意