mysq 多少数据量不推介使用索引 mysq索引失效

转载

技术博主 2024-06-13 08:20:29

文章标签 mysq 多少数据量不推介使用索引 mysql android 数据库联合索引 文章分类 数据仓库大数据

背景

无论你是技术大佬，还是刚入行的小白，时不时都会踩到Mysql数据库不走索引的坑。常见的现象就是：明明在字段上添加了索引，但却并未生效。

前些天就遇到一个稍微特殊的场景，同一条SQL语句，在某些参数下生效，在某些参数下不生效，这是为什么呢？

另外，无论是面试或是日常，Mysql索引失效的通常情况都应该了解和学习。

为了方便学习和记忆，这篇文件将常见的15种不走索引情况进行汇总，并以实例展示，帮助大家更好地避免踩坑。建议收藏，以备不时之需。

数据库及索引准备

创建表结构

为了逐项验证索引的使用情况，我们先准备一张表t_user：

CREATE TABLE `t_user` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT 'ID',
  `id_no` varchar(18) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '身份编号',
  `username` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '用户名',
  `age` int(11) DEFAULT NULL COMMENT '年龄',
  `create_time` datetime DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  PRIMARY KEY (`id`),
  KEY `union_idx` (`id_no`,`username`,`age`),
  KEY `create_time_idx` (`create_time`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

在上述表结构中有三个索引：

id：为数据库主键；
union_idx：为id_no、username、age构成的联合索引；
create_time_idx：是由create_time构成的普通索引；

初始化数据

初始化数据分两部分：基础数据和批量导入数据。

基础数据insert了4条数据，其中第4条数据的创建时间为未来的时间，用于后续特殊场景的验证：

INSERT INTO `t_user` (`id`, `id_no`, `username`, `age`, `create_time`) VALUES (null, '1001', 'Tom1', 11, '2022-02-27 09:04:23');
INSERT INTO `t_user` (`id`, `id_no`, `username`, `age`, `create_time`) VALUES (null, '1002', 'Tom2', 12, '2022-02-26 09:04:23');
INSERT INTO `t_user` (`id`, `id_no`, `username`, `age`, `create_time`) VALUES (null, '1003', 'Tom3', 13, '2022-02-25 09:04:23');
INSERT INTO `t_user` (`id`, `id_no`, `username`, `age`, `create_time`) VALUES (null, '1004', 'Tom4', 14, '2023-02-25 09:04:23');

除了基础数据，还有一条存储过程及其调用的SQL，方便批量插入数据，用来验证数据比较多的场景：

-- 删除历史存储过程
DROP PROCEDURE IF EXISTS `insert_t_user`

-- 创建存储过程
delimiter $

CREATE PROCEDURE insert_t_user(IN limit_num int)
BEGIN
 DECLARE i INT DEFAULT 10;
    DECLARE id_no varchar(18) ;
    DECLARE username varchar(32) ;
    DECLARE age TINYINT DEFAULT 1;
    WHILE i < limit_num DO
        SET id_no = CONCAT("NO", i);
        SET username = CONCAT("Tom",i);
        SET age = FLOOR(10 + RAND()*2);
        INSERT INTO `t_user` VALUES (NULL, id_no, username, age, NOW());
        SET i = i + 1;
    END WHILE;

END $
-- 调用存储过程
call insert_t_user(100);

关于存储过程的创建和存储，可暂时不执行，当用到时再执行。

数据库版本及执行计划

查看当前数据库的版本：

select version();
8.0.18

上述为本人测试的数据库版本：8.0.18。当然，以下的所有示例，大家可在其他版本进行执行验证。

查看SQL语句执行计划，一般我们都采用explain关键字，通过执行结果来判断索引使用情况。

执行示例：

explain select * from t_user where id = 1;

执行结果：

mysq 多少数据量不推介使用索引 mysq索引失效_mysql

可以看到上述SQL语句使用了主键索引（PRIMARY），key_len为4；

其中key_len的含义为：表示索引使用的字节数，根据这个值可以判断索引的使用情况，特别是在组合索引的时候，判断该索引有多少部分被使用到非常重要。

做好以上数据及知识的准备，下面就开始讲解具体索引失效的实例了。

1 联合索引不满足最左匹配原则

联合索引遵从最左匹配原则，顾名思义，在联合索引中，最左侧的字段优先匹配。因此，在创建联合索引时，where子句中使用最频繁的字段放在组合索引的最左侧。

而在查询时，要想让查询条件走索引，则需满足：最左边的字段要出现在查询条件中。

实例中，union_idx联合索引组成：

KEY `union_idx` (`id_no`,`username`,`age`)

最左边的字段为id_no，一般情况下，只要保证id_no出现在查询条件中，则会走该联合索引。

示例一：

explain select * from t_user where id_no = '1002';

explain结果：

mysq 多少数据量不推介使用索引 mysq索引失效_mysql_02

通过explain执行结果可以看出，上述SQL语句走了union_idx这条索引。

这里再普及一下key_len的计算：

id_no 类型为varchar(18)，字符集为utf8mb4_bin，也就是使用4个字节来表示一个完整的UTF-8。此时，key_len = 18* 4 = 72；
由于该字段类型varchar为变长数据类型，需要再额外添加2个字节。此时，key_len = 72 + 2 = 74；
由于该字段运行为NULL（default NULL），需要再添加1个字节。此时，key_len = 74 + 1 = 75；

上面演示了key_len一种情况的计算过程，后续不再进行逐一推演，知道基本组成和原理即可，更多情况大家可自行查看。

示例二：

explain select * from t_user where id_no = '1002' and username = 'Tom2';

explain结果：

mysq 多少数据量不推介使用索引 mysq索引失效_mysq 多少数据量不推介使用索引_03

很显然，依旧走了union_idx索引，根据上面key_len的分析，大胆猜测，在使用索引时，不仅使用了id_no列，还使用了username列。

示例三：

explain select * from t_user where id_no = '1002' and age = 12;

explain结果：

mysq 多少数据量不推介使用索引 mysq索引失效_联合索引_04

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：chatgpt内容复制到word 会出问题的拷贝到word是什么意思

下一篇：诺依框架技术支撑架构图若依框架优势

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯