MySQL基础

  • mysql 的查询流程
  • 索引是什么呢?
  • MySQL索引优缺点
  • MySQL索引分类


上一篇了解到了MySQL安装步骤,接下来就开始学习MySQL索引知识点

mysql 的查询流程

查询流程大致是:

mysql 客户端通过协议与 mysql 服务器建连接,发送查询语句,先检查查询缓存,如果命中,直接返回结果, 否则进行语句解析。

在解析查询之前,服务器会先访问查询缓存(query cache),它存储 SELECT 语句以及 相应的查询结果集。如果某个查询结果已经位于缓存中,服务器就不会再对查询进行解析、优化、以及执行。它仅仅将缓存中的结果返回给用户即可,这将大大提高系统的性能。

语法解析器和预处理:

首先 mysql 通过关键字将 SQL 语句进行解析,并生成一棵对应的“解析树”。mysql 解析 器将使用 mysql 语法规则验证和解析查询;预处理器则根据一些 mysql 规则进一步检查解析数是否合法。

查询优化器当解析树被认为是合法的了,并且由优化器将其转化成执行计划。一条查询可以有很多种执行方式, 最后都返回相同的结果。
优化器的作用就是找到这其中最好的执行计划。
然后,mysql 默认使用的 BTREE 索引,并且一个大致方向是:无论怎么折腾 sql,至少在目前来说,mysql 最多只 用到表中的一个索引。

索引是什么呢?

索引(Index)是帮助 MySQL 高效获取数据的数据结构。

可以得到索引的本质:索引是数据结构。
可以简单理解为排好序的快速查找数据结构。
相当于一本书的目录一样。

在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。下图就是一种可能的索引方式示例:

MySQL用索引进行全量查询 mysql索引查询流程_数据库


左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址。为了加快 Col2 的查找,可以维护一个 右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指 针,这样就可以运用 二叉查找在一定的复杂度内获取到相应数据,从而快速地检索出符合条件的记录。

一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。

MySQL索引优缺点

索引优点:

提高数据检索的效率,降低数据库的IO成本。
通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。

索引缺点:

虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为 更新所带来的键值变化后的索引信息。

实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的。

MySQL索引分类

聚簇索引和非聚簇索引

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式。术语‘聚簇’表示数据行和相邻的键值聚簇的存储 在一起。

MySQL用索引进行全量查询 mysql索引查询流程_聚簇索引_02


图中,左侧的索引就是聚簇索引,因为数据行在磁盘的排列和索引排序保持一致的

**聚簇索引的好处:**按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多 个数据块中提取数据,所以节省了大量的 io 操作。

**聚簇索引的限制:**对于mysql 数据库目前只有 innodb 数据引擎支持聚簇索引,而 Myisam 并不支持聚簇索引。 由于数据物理存储排序方式只能有一种,所以每个 Mysql 的表只能有一个聚簇索引。一般情况下就是 该表的主键。

为了充分利用聚簇索引的聚簇的特性,所以 innodb 表的主键列尽量选用有序的顺序 id,而不建议用 无序的 id,比如 uuid 这种。

索引有很多种类:

主键索引

概念:设定为主键后数据库会自动建立索引,innodb为聚簇索引

唯一索引

概念:索引列的值必须唯一,但允许有空值

复合索引

概念:即一个索引包含多个列

语法 :CREATE INDEX 索引名称

写到最后,一直在技术路上前行…

昨天,删去;今天,争取;明天,努力。