mysql 查询不到的数据计0 mysql数据量很少查询却很慢

转载

mob6454cc6575fa 2024-08-05 19:04:25

文章标签 mysql 查询不到的数据计0 mysql 数据库前端数据 文章分类 MySQL 数据库

近期在开发后台管理系统中，碰到了很多需要根据关键字来模糊查询记录的需求，在数据量很大的时候，会看到后端同学提示模糊查询会很慢，本篇文章将基于 MySQL 数据库来分析为什么会存在这种情况。

文章不涉及到代码，理论知识为主。讲解的 MySQL 中的存储引擎是 InnoDB

MySQL 存储数据格式预览

数据库即是我们一个业务系统中存储数据的地方，例如一个 txt 文件、一个 excel 文件都能做到存储数据，但在开发中，会选用"专业的"的工具来存储，如 MySQL 数据库，通过可视化工具可以预览一张数据表大概长这样

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_前端

像一个 Excel 表一样，有表头信息：

id（商品ID）
goods_title（商品的标题）
goods_sub_title（商品的副标题）
goods_url（商品的主图）
goods_price（商品的价格）

还有一些数据（随机生成的500万条），表的名称为 my_goods

假设下列场景，需要找到所有商品价格为 1300.1 的商品（随机选择的一个值），执行

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_前端_02

执行该查询花费了 1.22s ，查询过程很简单，从第一条开始，一直找到最后一条数据，期间如果遇到了商品价格是 1300.1 的商品，则记录下来，500万条数据都访问完成之后，返回那些符合条件的数据（这个操作称为全表扫描）

可以想象到，这种查询的效率是非常低的，当然也不符合这样的"专业工具"的能力，在 MySQL 中，有一个概念称为"索引"，即是为了提升查询速度的存在，接下来看一下索引的相关知识

索引、BTREE

事实上，my_goods 表在建表时，已经存在了一个针对 ID 字段建立的索引，通过下面这个需求可以体验到索引带来的速度查询提升：

找到商品 ID 是 4890000（随机选择的一个值）的商品

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_mysql 查询不到的数据计0_03

可以看到查询时间小于 0.000s，速度有了不小的提升，那么是怎么实现的呢

通常，在一组有序的数据中想查询某个值，可以用一个简单的算法，即二分查找（折半查找），如下列一组有序数据

1, 3, 5, 7, 9, 12, 15, 20, 22, 25, 30

通过二分查找的方式找到数字 20 所在的位置有下列过程：

找到这一组中间数（按照位置） 15，比较目标值与 15 的大小，20 > 15，目标值大于这个中间数，即需要查找的值在 15 的右边
接着将查找区间放在 15 - 30 中，同样取 15 - 30 中的中间数（按照位置） 22，20 < 22，目标值小于这个中间数，即需要查找的值在 22 的左边、15 的右边
接着在区间 15 - 22 中查找，取 15 - 22 的中间值 20（按照位置），找到目标值

上述过程，找到数字 20 只需 3 步，而如果从头开始找，找到数字 20 需要 8 步，由此提升了查找效率

在代码中与此相似的有一种数据结构：二叉树

二叉树有这些特点：

二叉树中一个节点能存储一个值，且允许有两个子节点
比自己小的值放在自己左边子节点
比自己大的值放在自己右边子节点

将上面的数据通过二叉树来表示（角标的小数字可以忽略，关注圆内的数值）：

代码程序会将上述数据转为二叉树结构，具体实现这里不展开

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_mysql 查询不到的数据计0_04

接下来找到数值为 20 的过程如下：

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_数据_05

比起原始的从第一条开始找数据找到最后一条有了一些提升，不过由于二叉树中的节点只能存储两个子节点（左右子节点），如果数据量很大的时候，这个树结构会非常深，在找树底下的数据时依然会存在一些效率问题

因此 MySQL 中使用的是 B+Tree （BPlusTree）结构，它是 BTree 的升级，但此篇文章从简出发，仅讨论 BTree 结构，以一颗最大度数为 5 的 BTree 为例，一个度数为 5 的 BTree 表示一个节点中最多可以储存 4 个值（二叉树中仅 1 个），最多可以有 5 个子节点（在二叉树中仅 2 个），随机插入一些数据：

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_mysql 查询不到的数据计0_06

每个节点中存储的格式为 "指针、数据、指针、数据、指针..."（注意图中的线条是从每个数值的左右两边出发的，线条这里称为指针），指针和数据也是有序的，从小到大排列，也就是说某一个指针指向的节点中的所有数据是和该指针左右侧数据有大小关系的，例如下图中，红色指针指向的红色框节点中的所有值都是大于该红色指针左侧的数值 90，而小于该红色指针右侧的数据 169 的

mysql 查询不到的数据计0 mysql数据量很少查询却很慢_前端_07