此后会针对数据库索引出一系列的文章,敬请期待


前言—学习索引几大理由

  • 高薪程序员必备知识,无论去哪里面试,数据库的索引优化是必考知识


  • 工作必备,无论任何系统都要和数据库打交道,当数据量达到百万级以上,查询速度就会变慢,影响数据库的并发,从而影响整体的系统并发


  • 不会数据库索引的程序员,不是一个合格的程序员MySQL索引优化系列(1)—索引介绍_数据MySQL索引优化系列(1)—索引介绍_数据,所以快来学习索引吧,哈哈



索引是什么

MySQL官方对索引的定义为:​索引(Index)是帮助MySQL高校获取数据的数据结构。


可以得到索引的本质:索引是数据结构,索引的目的是提高查询效率,可以类比英语新华字典,如果我们要查询MySQL这个单词,首先我们需要在目录(索引)定位到M,然后在定位到y,以此类推找到SQL。


如果没有索引呢,那就需要从A到Z,去遍历的查找一遍,直到找到我们需要的,一个一个找和直接根据目录定位到数据,是不是差的天壤之别呢,这就是索引的妙用。


索引底层数据结构

当数据量大的时候,索引的数据量也很大,所以索引不可能全部放到内存中,因此索引一般以文件的形式存储到硬盘上。


数据本身之外,数据库还维护着一个满足特定查找算法的数据结构,这些结构以某种方式指向数据,这样就可以基于这些数据结构实现高级查找算法。


MySQL索引优化系列(1)—索引介绍_数据库_03


索引算法种类

  • B-tree索引(重点掌握,之后文章详细讲解)

  • Hash索引

  • full-text索引

  • R-tree索引


索引的优势

  • 类似大学图书馆书目索引,提高数据检索效率,降低数据库IO成本


  • 通过索引列对数据进行排序,降低数据排序成本,降低了CPU消耗


索引的劣势

  • 实际上索引也是一张表,该表保存了主键和索引字段,并指向实体表的记录,所以索引列也是要占用空间的


  • 虽然索引大大提高了查询速度,同时却会降低更新表的速度,如果对表INSERT,UPDATE和DELETE。因为更新表时,MySQL不仅要不存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息


  • 索引只是提高效率的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立优秀的索引,或优化查询语句


索引分类

  • 单值索引:即一个索引只包含单个列,一个表可以有多个单列索引


  • 唯一索引:索引列的值必须唯一,但允许有空值


  • 复合索引:即一个索引包含多个列


索引语法

  • 创建一:create [unique] index indexName on tableName (columnName (length) )。

如果是CHAR,VARCHAR类型,length可以小于字段实际长度;如果是

BLOB和TEXT类型,必须指定length。


  • 创建二:alter tableName add [unique] index [indexName] on (columnName (length) )


  • 删除:DROP INDEX [indexName] ON mytable;


  • 查看:SHOW INDEX FROM table_name\G


MySQL索引优化系列(1)—索引介绍_数据_04 

哪些情况需要建索引

  • 主键自动建立唯一索引


  • 频繁作为查询的条件的字段应该创建索引


  • 查询中与其他表关联的字段,外键关系建立索引


  • 频繁更新的字段不适合创建索引:因为每次更新不单单是更新了记录还会更新索引,加重IO负担


  • Where条件里用不到的字段不创建索引


  • 单间/组合索引的选择问题(在高并发下倾向创建组合索引)


  • 查询中排序的字段,若通过索引去访问将大大提高排序的速度


  • 查询中统计或者分组字段


哪些不适合建索引

  • 表记录太少


  • 经常增删改的表


  • 数据重复且分布平均的表字段,因此应该只为经常查询和经常排序的数据列建立索引。注意,如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果。


今天索引先介绍到这来,之后文章会围绕索引优化讲解