自适应哈希索引

原创

louteq 2017-03-27 11:49:18 ©著作权

©著作权归作者所有：来自51CTO博客作者louteq的原创作品，请联系作者获取转载授权，否则将追究法律责任

InnoDB存储引擎会监控对表上索引的查找，如果观察到建立哈希索引可以带来速度的提升，则建立哈希索引，所以称之为自适应（adaptive）的。自适应哈希索引通过缓冲池的B+树构造而来，因此建立的速度很快。而且不需要将整个表都建哈希索引，InnoDB存储引擎会自动根据访问的频率和模式来为某些页建立哈希索引。

根据InnoDB的官方文档显示，启用自适应哈希索引后，读取和写入速度可以提高2倍；对于辅助索引的连接操作，性能可以提高5倍。在我看来，自适应哈希索引是非常好的优化模式，其设计思想是数据库自优化（self-tuning），即无需DBA对数据库进行调整。

通过命令SHOW ENGINE INNODB STATUS可以看到当前自适应哈希索引的使用状况，如下所示：

1.mysql> show engine innodb status\G;

2.*************************** 1. row ***************************

3.Status:

4.=====================================

5.090922 11:52:51 INNODB MONITOR OUTPUT

6.=====================================

7.Per second averages calculated from the last 15 seconds

8.......

9.-------------------------------------

10.INSERT BUFFER AND ADAPTIVE HASH INDEX

11.-------------------------------------

12.Ibuf: size 2249, free list len 3346, seg size 5596,

13.374650 inserts, 51897 merged recs, 14300 merges

14.Hash table size 4980499, node heap has 1246 buffer(s)

15.1640.60 hash searches/s, 3709.46 non-hash searches/s

16.......

现在可以看到自适应哈希索引的使用信息了，包括自适应哈希索引的大小、使用情况、每秒使用自适应哈希索引搜索的情况。值得注意的是，哈希索引只能用来搜索等值的查询，如select * from table where index_col = 'xxx'，而对于其他查找类型，如范围查找，是不能使用的。因此，这里出现了non-hash searches/s的情况。用hash searches : non-hash searches命令可以大概了解使用哈希索引后的效率。

由于自适应哈希索引是由InnoDB存储引擎控制的，所以这里的信息只供我们参考。不过我们可以通过参数innodb_adaptive_hash_index来禁用或启动此特性，默认为开启。

Adaptive，意味着不是所有的叶页面都会以Hash索引维护，叶页面进入Hash 索引的条件是：同种类型的操作(Scan/Insert…)，命中同一叶页面的次数，超过此页面记录数量的1/16，则可将当前叶页面加入Hash索引，用以优化后续可能的相同Search Path。

mysql> show variables like '%adaptive_hash%';

+----------------------------+-------+

| Variable_name | Value |

+----------------------------+-------+

| innodb_adaptive_hash_index | ON |

+----------------------------+-------+

默认为开启