今天我们来实际试验一下mysql中引起全表扫描的那些sql语句,并给出优化方案。
我们使用总数大概为130W表结构如下所示的数据表来做实验
CREATE TABLE `wjdcxx` (
`id` int unsigned NOT NULL AUTO_INCREMENT,
`userid` varchar(255) DEFAULT NULL,
`bh` varchar(255) DEFAULT NULL,
`title` varchar(255) DEFAULT NULL,
`username` varchar(255) DEFAULT NULL,
`usertype` varchar(255) DEFAULT NULL,
`answeredcount` varchar(255) DEFAULT NULL,
`answered` varchar(255) DEFAULT NULL,
`answerdate` datetime DEFAULT NULL,
`qtitle` varchar(255) DEFAULT NULL,
`item` varchar(255) DEFAULT NULL,
`answer` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1371690 DEFAULT CHARSET=utf8
1、对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。
select id from wjdcxx where username="付琨实";
我们在username字段上建立普通索引后
秒开
分析sql语句可以看到,此sql完全索引覆盖
我们再来试验一下order by 字句
建立索引后显然也是秒开
2、注意在 where 子句中对字段进行 null 值判断,的各种情况,否则将导致引擎放弃使用索引而进行全表扫描,关于is null 和is not null的使用要特别注意
(1)当索引字段可以为空时
where子句中使用 is null 不会影响索引覆盖,哪怕是使用了select * 查询全部字段。
where 字句中使用 is not null 只有当查询的字段都有索引时才会用到索引,否则会全表扫描。
(2)但索引字段不可以为null时
where子句中使用is null是个伪条件
where 子句中使用is not null 只有当查询字段只包含 主键索引和本索引字段 会用到索引。(包含其他索引字段都不行,暂时不知道为什么,如下图最后一个)
3、应尽量避免在 where 子句中使用!=或<>操作符,否则引擎将放弃使用索引而进行全表扫描。
4、应尽量避免在 where 子句中使用or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,
5、in 和 not in 也要慎用,否则会导致全表扫描,
如:
select id from t where num in(1,2,3);
对于连续的数值,能用 between 就不要用 in 了:
select id from t where num between 1 and 3;
6、下面的查询也将导致全表扫描。
select * from wjdcxx where username like "%范%";
select * from wjdcxx where username like "%范";
若要提高效率,可以使用此格式
select * from wjdcxx where username like "范%";
也可以考虑全文检索。
7、避免在索引列上使用计算,也就是说,应尽量避免在 where 子句中对字段进行表达式操作和函数操作,这将导致引擎放弃使用索引而进行全表扫描。
如:
select id from wjdcxx where num/2=100;
应改为:
select id from wjdcxx where num=100*2
再如
select id from wjdcxx where substring(username,1,3)='abc';
应该为
select id from wjdcxx where username like 'abc%';
8、很多时候用 exists 代替 in 是一个好的选择:exists用于检查子查询是否至少会返回一行数据,该子查询实际上并不返回任何数据,而是返回值true或false。
select num from a where num in(select num from b)
用下面的语句替换:
select num from a where exists (select 1 from b where num=a.num)
9、任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。
10、用>=替代>
高效:
SELECT * FROM EMP WHERE DEPTNO >=4
低效:
SELECT * FROM EMP WHERE DEPTNO >3
两者的区别在于, 前者DBMS将直接跳到第一个DEPT等于4的记录,而后者将首先定位到DEPTNO=3的记录并且向前扫描到第一个DEPT大于3的记录。
1、Where子句替换having子句