一个索引包含所有需要查询的字段,称之为"覆盖索引"

覆盖索引,查询只需要扫描索引而无须回表,优点

索引条目远小于数据行大小,如果只需要读取索引,MySQL会极大减少数据访问量

  • 这对缓存负载非常重要,这种情况下响应时间大部分花在数据拷贝上
  • 对IO密集型应用也有帮助,索引更容易全部放入内存中

索引按照列值顺序存储的,对于IO密集型查询范围会比随机从磁盘读取每一行数据IO要少得多

由于InnoDB聚簇索引,覆盖索引对InnoDB特别有用

InnoDB中,二级索引在叶子节点中保存了行的主键值

若二级主键能够覆盖查询,可以避免对主键索引二次查询

覆盖索引必须要存储索引列的值

哈希索引,空间索引和全文索引等不存储索引列的值,MySQL只能用B-Tree索引做覆盖索引

索引覆盖查询

MySQL 覆盖索引_数据集

在 EXPLAIN 的 Extra 列看到 Using index 信息,这个查询就是一个索引覆盖查询

MySQL查询优化器在执行查询前会判断是否有一个索引能进行覆盖,如果是false也会回表获取数据行

MySQL不能在索引中执行LIKE操作,但是支持在索引中做最左前缀匹配的LIKE比较

延迟关联(deferred join)

案例1

MySQL 覆盖索引_数据集_02

通过覆盖索引查询返回需要的主键,再根据主键关联原表获得需要的行

案例2

先扩展索引到查询涉及的所有列,然后重写查询

MySQL 覆盖索引_mysql_03

这种方式延迟了对列的访问,所以叫做延迟关联

在查询的第一阶段MySQL可以使用覆盖索引,在FROM子句的子查询找到匹配的prod_id

根据这些prod_id值在外层查询匹配获取需要的所有列值

优化效果取决于WHERE条件匹配返回的行

MySQL 覆盖索引_结果集_04

测试结果

MySQL 覆盖索引_数据_05

第一个数据集,查询返回的结果集很大,大部分时间都在读取和发送数据

第二个数据集,经过索引过滤,返回了很少的结果集

第三个数据集,索引过滤时符合第一个条件的结果集已经很小了,子查询带来的成本反而更高

论读书
睁开眼,书在面前 闭上眼,书在心里