SQL优化的若干实用小建议

原创

博学谷狂野架构师 2022-11-08 16:41:00 ©著作权

©著作权归作者所有：来自51CTO博客作者博学谷狂野架构师的原创作品，请联系作者获取转载授权，否则将追究法律责任

6.1 优化insert语句

当进行数据的insert操作的时候，可以考虑采用以下几种优化方案。

如果需要同时对一张表插入很多行数据时，应该尽量使用多个值表的insert语句
这种方式将大大的缩减客户端与数据库之间的连接、关闭等消耗。
使得效率比分开执行的单个insert语句快。
示例，原始方式为：

insert into xxx values(1,'Tom');
insert into xxx values(2,'Cat');
insert into xxx values(3,'Jerry');

优化后的方案为：

insert into xxx values(1,'Tom'),(2,'Cat')，(3,'Jerry');

数据有序插入

insert into tb_test values(4,'Tim');
insert into tb_test values(1,'Tom');
insert into tb_test values(3,'Jerry');
insert into tb_test values(5,'Rose');
insert into tb_test values(2,'Cat');

优化后

insert into tb_test values(1,'Tom');
insert into tb_test values(2,'Cat');
insert into tb_test values(3,'Jerry');
insert into tb_test values(4,'Tim');
insert into tb_test values(5,'Rose');

6.2 优化order by语句

6.2.1 环境准备

CREATE TABLE `emp` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(100) NOT NULL,
  `age` int(3) NOT NULL,
  `salary` int(11) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8;

insert into `emp` (`id`, `name`, `age`, `salary`) values('1','Tom','25','2300');
insert into `emp` (`id`, `name`, `age`, `salary`) values('2','Jerry','30','3500');
insert into `emp` (`id`, `name`, `age`, `salary`) values('3','Luci','25','2800');
insert into `emp` (`id`, `name`, `age`, `salary`) values('4','Jay','36','3500');
insert into `emp` (`id`, `name`, `age`, `salary`) values('5','Tom2','21','2200');
insert into `emp` (`id`, `name`, `age`, `salary`) values('6','Jerry2','31','3300');
insert into `emp` (`id`, `name`, `age`, `salary`) values('7','Luci2','26','2700');
insert into `emp` (`id`, `name`, `age`, `salary`) values('8','Jay2','33','3500');
insert into `emp` (`id`, `name`, `age`, `salary`) values('9','Tom3','23','2400');
insert into `emp` (`id`, `name`, `age`, `salary`) values('10','Jerry3','32','3100');
insert into `emp` (`id`, `name`, `age`, `salary`) values('11','Luci3','26','2900');
insert into `emp` (`id`, `name`, `age`, `salary`) values('12','Jay3','37','4500');

create index idx_emp_age_salary on emp(age,salary);

6.2.2 两种排序方式

1). 第一种是通过对返回数据进行排序，也就是通常说的 filesort 排序

tips
不是通过索引直接返回排序结果的排序都叫 FileSort 排序。

explain  select  *  from emp  order by  age  desc;
explain  select  *  from emp  order by  age  asc;

SQL优化的若干实用小建议_字段

2). 第二种通过有序索引顺序扫描直接返回有序数据，这种情况即为 using index，

不需要额外排序，操作效率高。

explain  select  id from emp  order by  age  asc;
explain  select  id,age  from emp  order by  age  asc;
explain  select  id,age,salary  from emp  order by  age  asc;

SQL优化的若干实用小建议_字段_02

多字段排序

-- 多字段排序
explain  select  id,age,salary  from emp  order by  age, salary;
explain  select  id,age,salary  from emp  order by  age desc, salary desc;

explain  select  id,age,salary  from emp  order by  salary desc, age desc;
explain  select  id,age,salary  from emp  order by  age desc, salary asc ;

总结：

了解了MySQL的排序方式，优化目标就清晰了：

尽量减少额外的排序，通过索引直接返回有序数据。

where 条件和Order by 使用相同的索引，并且Order By 的顺序和索引顺序相同，并且Order by 的字段都是升序，或者都是降序。否则肯定需要额外的操作，这样就会出现FileSort。

6.2.3 Filesort 的优化原理

tips
了解即可

通过创建合适的索引，能够减少 Filesort 的出现，但是在某些情况下，条件限制不能让Filesort消失，那就需要加快 Filesort的排序操作。对于Filesort ， MySQL 有两种排序算法：

1）两次扫描算法：MySQL4.1 之前，使用该方式排序。首先根据条件取出排序字段和行指针信息，然后在排序区 sort buffer 中排序，如果sort buffer不够，则在临时表 temporary table 中存储排序结果。完成排序之后，再根据行指针回表读取记录，该操作可能会导致大量随机I/O操作。

2）一次扫描算法：一次性取出满足条件的所有字段，然后在排序区 sort buffer 中排序后直接输出结果集。排序时内存开销较大，但是排序效率比两次扫描算法要高。

MySQL 通过比较系统变量 max_length_for_sort_data 的大小和Query语句取出的字段总大小，来判定使用哪种排序算法，如果max_length_for_sort_data 更大，那么使用第二种优化之后的算法；否则使用第一种。

可以适当提高 sort_buffer_size 和 max_length_for_sort_data 系统变量，来增大排序区的大小，提高排序的效率。

show  variables like 'max_length_for_sort_data';
show  variables  like 'sort_buffer_size';

6.3 优化group by 语句

tips
延续使用6.2 优化order by语句中创建的表emp

创建索引（准备工作）：

create index idx_emp_age_salary on emp(age,salary);

由于GROUP BY 实际上也同样会进行排序操作，而且与ORDER BY 相比，GROUP BY 主要只是多了排序之后的分组操作。

当然，如果在分组的时候还使用了其他的一些聚合函数，那么还需要一些聚合函数的计算。所以，在GROUP BY 的实现过程中，与 ORDER BY 一样也可以利用到索引。

如果查询包含 group by 但是用户想要避免排序结果的消耗，则可以执行order by null 禁止排序。如下：

drop index idx_emp_age_salary on emp;
explain select age,count(*) from emp group by age;

SQL优化的若干实用小建议_数据_03

优化后

explain select age,count(*) from emp group by age order by null;

SQL优化的若干实用小建议_Java_04

从上面的例子可以看出，第一个SQL语句需要进行"filesort"，而第二个SQL由于order by null 不需要进行 "filesort"，而上文提过Filesort往往非常耗费时间。

6.4 优化嵌套查询

tips
延续使用4.3 使用explain分析执行计划中创建的表

Mysql4.1版本之后，开始支持SQL的子查询。这个技术可以使用SELECT语句来创建一个单列的查询结果，然后把这个结果作为过滤条件用在另一个查询中。使用子查询可以一次性的完成很多逻辑上需要多个步骤才能完成的SQL操作，同时也可以避免事务或者表锁死，并且写起来也很容易。但是，有些情况下，子查询是可以被更高效的连接（JOIN）替代。

示例，查找有角色的所有的用户信息 :

explain select * from t_user where id in (select user_id from user_role );

执行计划为 :

SQL优化的若干实用小建议_数据_05

优化后 :

explain select * from t_user u , user_role ur where u.id = ur.user_id;

SQL优化的若干实用小建议_mysql_06

连接(Join)查询之所以更有效率一些，是因为MySQL不需要在内存中创建临时表来完成这个逻辑上需要两个步骤的查询工作。

6.5 使用SQL提示

tips：
延续使用5.2.1 准备环境中创建的表

SQL提示，是优化数据库的一个重要手段，简单来说，就是在SQL语句中加入一些人为的提示来达到优化操作的目的。

6.5.1 USE INDEX

在查询语句中表名的后面，添加 use index 来提供希望MySQL去参考的索引列表，就可以让MySQL不再考虑其他可用的索引。

create index idx_seller_name on tb_seller(name);

explain select  *  from tb_seller  where name='小米科技'
explain select  *  from tb_seller use index(idx_seller_name)  where name='小米科技'

SQL优化的若干实用小建议_数据_07

6.5.2 IGNORE INDEX

如果用户只是单纯的想让MySQL忽略一个或者多个索引，则可以使用 ignore index 作为 hint 。

explain select * from tb_seller ignore index(idx_seller_name_sta_addr) where name = '小米科技';

SQL优化的若干实用小建议_字段_08

6.5.3 FORCE INDEX

为强制MySQL使用一个特定的索引，可在查询中使用 force index 作为hint 。

create index idx_seller_address on tb_seller(address);
explain select * from tb_seller force index(idx_seller_address) where address = '北京市';

SQL优化的若干实用小建议_mysql_09

往期干货：

怎样才能快速成为一名架构师？
如何从Java工程师成长为架构师？
六种常用事务解决方案，你方唱罢，我登场（没有最好只有更好）
超详细教程，一文入门Istio架构原理及实战应用
【图解源码】Zookeeper3.7源码剖析，Session的管理机制，Leader选举投票规则，集群数据同步流程
【图解源码】Zookeeper3.7源码分析，包含服务启动流程源、网络通信、RequestProcessor处理请求
【知其然，知其所以然】配置中心 Apollo源码剖析
【推荐】我认为这是最完整的Apollo教程从入门到精通
探针技术-JavaAgent 和字节码增强技术-Byte Buddy
100003字，带你解密双11、618电商大促场景下的系统架构体系
【开悟篇】Java多线程之JUC从入门到精通
12437字，带你深入探究RPC通讯原理
JVM调优实战演练，妈妈再也不同担心我的性能优化了
13651个字，给你解释清楚 JVM对象销毁
搞不懂JVM的类加载机制，JVM性能优化从何谈起？
4859字，609行，一次讲清楚JVM运行数据区
让实习生搭个Redis集群，差点把我”搭“进去~~~
我用Redis分布式锁，抢了瓶茅台，然后GG了~~
新来的，你说下Redis的持久化机制，哪一种能解决我们遇到的这个业务问题？

本文由传智教育博学谷 - 狂野架构师教研团队发布如果本文对您有帮助，欢迎关注和点赞；如果您有任何建议也可留言评论或私信，您的支持是我坚持创作的动力转载请注明出处！

上一篇：死锁的3种死法

下一篇：一文参透分布式存储系统Ceph的架构设计、集群搭建（手把手）

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯