一、索引的本质
索引是帮助Mysql高效获取数据的排好序的数据结构。
索引数据结构:
1、二叉树
2、红黑树
3、Hash表
4、B-Tree
例:如下面一张表
无索引:
查找 col2=89的数据,会进行全表扫描,从第一个开始往下面扫描,直到找到col2=89为止,需要查找至少6次。
select * from t where t.col2=89;
有索引(二叉树):
如图右侧所画,二叉树的规则是左边小,右边大。将所有的值按照二叉树数据结构排列,当查找col2=89时:从根节点,找89,比34大,找右侧。找两次就找到了。
但是,MySQL里面并不是使用的二叉树,因为当以自增主键为索引时,建成的二叉树其实和主键索引没什么区别,因为自增会一直往二叉树的右侧去增加,最终形成的是一条链表,不能起到二叉树的效果。如图:
二、红黑树讲解
当索引递增增长的话,不会单边的一直增长,会有一个平衡的工程,不至于像上面的二叉树那样一边倒的状况出现。
但是,MySQL里面并不是使用的红黑树,因为当数量很大的售后,树的层数太多了。
三、B+树讲解
叶子节点从左到右依次递增,而且包含所有数据。
如图所示,B+树在横向上面做了拓展,因此,纵向上面数据没有那么多层,当查找数据30时:56–》20–》30,只需要查找三次。
四、hash表
如图,我们在建索引时候,是可以选择hash方式的。
hash形式,会把每个数据进行hash运算,然后这个运算结果会与此数据存储指针的指针地址一一对应。
五、mylsam存储引擎(用得少)
6、innodb存储引擎讲解
问题一:为什么innodb表必须有主键?并且推荐使用整型的自增主键?
(1)因为主键会自带索引,并且将索引存在B+树里面,从而将整张表的数据组织好,放到B+树里面去。当你没有建主键的话,mysql会自动帮你从所建的列里面找到一个数据不重复的列作为主键列,当这样的列不存在时,mysql会在表末尾加一个隐藏列,作为主键。
(2)例如使用uuid作为主键,并非整型,也不是自增的,这样是不利于数据查找的。因为我们在一个B+树里面,查找一个数据,是通过数据间对比进行查找的,整型一定会比字符串型比较快,所以选用整型,其次,整型占用的存储空间也比uuid要节省。当主键是自增时,每增加一条数据都会像B+tree的右侧去加数据,尽可能不会插在已存在数据中间,增加了效率。
七、索引最左前缀原理
当有(a,b,c)联合索引时:会先按照a大小进行B+tree的排列,然后然后按照b,c依次进行B+tree的排列。
select * from employee where a = ? and b=? and c=?
1、当有a,b,c时,走索引。
2、当只有b,c时,不会走索引。(因为a字段要全表扫描)。
3、当只有a,b时,会走前两个字段索引,不会走第三个字段索引。
4、当只有a,c时,只会走a字段索引,不会走b,c字段索引。