一、索引的本质

索引是帮助Mysql高效获取数据的排好序的数据结构。

索引数据结构:

1、二叉树

2、红黑树

3、Hash表

4、B-Tree

例:如下面一张表

mysql 二级索引数据结构 mysql 二级索引原理_二叉树


无索引:

查找 col2=89的数据,会进行全表扫描,从第一个开始往下面扫描,直到找到col2=89为止,需要查找至少6次。

select * from t where t.col2=89;

有索引(二叉树):

如图右侧所画,二叉树的规则是左边小,右边大。将所有的值按照二叉树数据结构排列,当查找col2=89时:从根节点,找89,比34大,找右侧。找两次就找到了。

但是,MySQL里面并不是使用的二叉树,因为当以自增主键为索引时,建成的二叉树其实和主键索引没什么区别,因为自增会一直往二叉树的右侧去增加,最终形成的是一条链表,不能起到二叉树的效果。如图:

mysql 二级索引数据结构 mysql 二级索引原理_数据结构_02

二、红黑树讲解

mysql 二级索引数据结构 mysql 二级索引原理_数据结构_03


当索引递增增长的话,不会单边的一直增长,会有一个平衡的工程,不至于像上面的二叉树那样一边倒的状况出现。

但是,MySQL里面并不是使用的红黑树,因为当数量很大的售后,树的层数太多了。

三、B+树讲解

叶子节点从左到右依次递增,而且包含所有数据。

mysql 二级索引数据结构 mysql 二级索引原理_二叉树_04


如图所示,B+树在横向上面做了拓展,因此,纵向上面数据没有那么多层,当查找数据30时:56–》20–》30,只需要查找三次。

四、hash表

如图,我们在建索引时候,是可以选择hash方式的。

mysql 二级索引数据结构 mysql 二级索引原理_数据结构_05


hash形式,会把每个数据进行hash运算,然后这个运算结果会与此数据存储指针的指针地址一一对应。

五、mylsam存储引擎(用得少)

mysql 二级索引数据结构 mysql 二级索引原理_指针_06

6、innodb存储引擎讲解

mysql 二级索引数据结构 mysql 二级索引原理_数据结构_07


问题一:为什么innodb表必须有主键?并且推荐使用整型的自增主键?

(1)因为主键会自带索引,并且将索引存在B+树里面,从而将整张表的数据组织好,放到B+树里面去。当你没有建主键的话,mysql会自动帮你从所建的列里面找到一个数据不重复的列作为主键列,当这样的列不存在时,mysql会在表末尾加一个隐藏列,作为主键。

(2)例如使用uuid作为主键,并非整型,也不是自增的,这样是不利于数据查找的。因为我们在一个B+树里面,查找一个数据,是通过数据间对比进行查找的,整型一定会比字符串型比较快,所以选用整型,其次,整型占用的存储空间也比uuid要节省。当主键是自增时,每增加一条数据都会像B+tree的右侧去加数据,尽可能不会插在已存在数据中间,增加了效率。

七、索引最左前缀原理

mysql 二级索引数据结构 mysql 二级索引原理_二叉树_08


当有(a,b,c)联合索引时:会先按照a大小进行B+tree的排列,然后然后按照b,c依次进行B+tree的排列。

select * from employee where a = ? and b=? and c=?

1、当有a,b,c时,走索引。

2、当只有b,c时,不会走索引。(因为a字段要全表扫描)。

3、当只有a,b时,会走前两个字段索引,不会走第三个字段索引。

4、当只有a,c时,只会走a字段索引,不会走b,c字段索引。