mysql大小表连接顺序 mysql 大小表关联查询优化

转载

mob64ca13f27a4c 2023-08-11 21:37:58

文章标签 mysql大小表连接顺序字段数据 MySQL 文章分类 MySQL 数据库

关联查询优化

1、保证被驱动表的join字段已经被索引
2、left join 时，选择小表作为驱动表，大表作为被驱动表。但是 left join 时一定是左边是驱动表，右边是被驱动表 right join 相反
3、inner join 时，mysql会自己帮你把小结果集的表选为驱动表。mysql 自动选择。小表作为驱动表。因为驱动表无论如何都会被全表扫描？。所以扫描次数越少越好
4、子查询尽量不要放在被驱动表，有可能使用不到索引。

子查询优化用in 还是 exists

1、有索引的情况下用
inner join 是最好的其次是 in ，exists最糟糕
2、无索引的情况下用
小表驱动大表因为join 方式需要distinct ，没有索引distinct消耗性能较大所以 exists性能最佳 in其次 join性能最差
3、无索引的情况下大表驱动小表
in 和 exists 的性能应该是接近的都比较糟糕 exists稍微好一点超不过5% 但是inner join 优于使用了 join buffer 所以快很多，如果left join 则最慢

order by关键字优化

1、ORDER BY子句，尽量使用Index方式排序,避免使用FileSort方式排序
MySQL支持二种方式的排序，FileSort和Index，Index效率高.它指MySQL扫描索引本身完成排序。FileSort方式效率较低。
2、ORDER BY满足两情况，会使用Index方式排序:
ORDER BY 语句使用索引最左前列
使用Where子句与Order BY子句条件列组合满足索引最左前列
where子句中如果出现索引的范围查询(即explain中出现range)会导致order by 索引失效。
3、如果不在索引列上，filesort有两种算法：mysql就要启动双路排序和单路排序
双路排序：MySQL 4.1之前是使用双路排序,字面意思就是两次扫描磁盘，最终得到数据，读取行指针和orderby列，对他们进行排序，然后扫描已经排序好的列表，按照列表中的值重新从列表中读取对应的数据输出
多路排序需要借助磁盘来进行排序。所以取数据，排好了取数据。两次 io操作。比较慢
单路排序：从磁盘读取查询需要的所有列，按照order by列在buffer对它们进行排序，然后扫描排序后的列表进行输出，
它的效率更快一些，避免了第二次读取数据。并且把随机IO变成了顺序IO,但是它会使用更多的空间，因为它把每一行都保存在内存中了。
将排好的数据存在内存中，省去了一次 io 操作，所以比较快，但是需要内存空间足够。
单路存在的问题：
在sort_buffer中，方法B比方法A要多占用很多空间，因为方法B是把所有字段都取出, 所以有可能取出的数据的总大小超出了sort_buffer的容量，导致每次只能取sort_buffer容量大小的数据，进行排序（创建tmp文件，多路合并），排完再取取sort_buffer容量大小，再排……从而多次I/O。
本来想省一次I/O操作，反而导致了大量的I/O操作，反而得不偿失。
优化策略：
1、增大sort_buffer_size参数的设置：用于单路排序的内存大小
2、增大max_length_for_sort_data参数的设置：单次排序字段大小。(单次排序请求)
3、去掉select 后面不需要的字段：select 后的多了，排序的时候也会带着一起，很占内存，所以去掉没有用的

提高Order By的速度

Order by时select * 是一个大忌只Query需要的字段，这点非常重要。在这里的影响是：
1.1 当Query的字段大小总和小于max_length_for_sort_data 而且排序字段不是 TEXT|BLOB 类型时，会用改进后的算法——单路排序，否则用老算法——多路排序。
1.2 两种算法的数据都有可能超出sort_buffer的容量，超出之后，会创建tmp文件进行合并排序，导致多次I/O，但是用单路排序算法的风险会更大一些,所以要提高sort_buffer_size。
尝试提高 sort_buffer_size
不管用哪种算法，提高这个参数都会提高效率，当然，要根据系统的能力去提高，因为这个参数是针对每个进程的
尝试提高 max_length_for_sort_data
提高这个参数，会增加用改进算法的概率。但是如果设的太高，数据总容量超出sort_buffer_size的概率就增大，明显症状是高的磁盘I/O活动和低的处理器使用率.

limit 优化

实践证明：
①、order by 后的字段（XXX）有索引 ②、sql 中有 limit 时，
当 select id 或 XXX字段索引包含字段时，显示 using index
当 select 后的字段含有 oeder by 字段索引不包含的字段时，将显示 using filesort

GROUP BY关键字优化。同order by 有一点不同

where高于having，能写在where限定的条件就不要去having限定了。

去重优化

t_mall_sku 表
id shp_id kcdz

3       1    北京市昌平区  
 4       1    北京市昌平区  
 5       5    北京市昌平区  
 6       3       重庆              
 8       8     天津

例子：select kcdz form t_mall_sku where id in( 3,4,5,6,8 ) 将产生重复数据，
select distinct kcdz form t_mall_sku where id in( 3,4,5,6,8 ) 使用 distinct 关键字去重消耗性能
优化： select kcdz form t_mall_sku where id in( 3,4,5,6,8 ) group by kcdz 能够利用到索引

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。