文章目录
- 慢日志统计与分析查看
- EXPLAIN执行计划
- sql索引优化
- 在实际操作过程中,应该选取表中哪些字段作为索引?
慢日志统计与分析查看
在Mysql中,支持慢日志记录功能,通过指定统计执行时间阈值与日志存放位置来实现
Mysql默认统计时间为10s,而且默认统计是关闭的,那么如何开启统计呢?
这里分为两种情况
第一种情况是在mysql ini配置文件中添加键和值,通常适用于从数据库启动即开启统计日志
第二种情况是在不适合关闭服务器而临时需要统计时(在mysql下次关闭前都有效),可以通过命令直接设置,然后重新创建一个连接即可
具体设置如下:
首先查看是否开启了统计
SHOW VARIABLES LIKE '%query%';
如果slow_query_log的值为OFF则表示没有开启。
第一种:找到my.ini文件,配置如下,并重启mysql服务
[mysqld]
slow_query_log = on; #打开慢查询
long_query_time = 1 #设置统计时间阈值,sql执行超过这个时间即统计,单位是秒
slow_query_log_file = /tmp/slow.log #日志存放位置
第二种:打开mysql客户端,执行下面的语句
SET GLOBAL slow_query_log = on;#打开慢日志统计
SET GLOBAL long_query_time = 2.000000;#设置统计时间阈值,sql执行超过这个时间即统计,单位是秒
设置后重新启动客户端连接后再次查看slow_query_log属性值,如果为ON则设置成功
设置完成之后需要重新连接数据库才能生效
EXPLAIN执行计划
通过日志我们可以获取到慢sql信息,就可以针对性的优化,Mysql提供了Explain关键字帮助我们分析sql语句的执行方式
EXPLAIN + sql查询语句 #语法,一般来说我们分析的都是查找的性能,所以是查询语句
示例:
EXPLAIN SELECT * FROM convertedfile WHERE id = 1
这是一条简单的SQL,通过主键查找唯一的记录,运行结果如下
可以看到结果中包含10列信息,分别为
id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra
对应的简单描述如下:
id: select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序===id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
select_type: 表示查询的类型。用于区别普通查询、联合查询、子查询等的复杂查询。
table: 输出结果集的表 显示这一步所访问数据库中表名称(显示这一行的数据是关于哪张表的),有时不是真实的表名字,可能是简称,例如上面的e,d,也可能是第几步执行的结果的简称
partitions:匹配的分区
type:对表访问方式,表示MySQL在表中找到所需行的方式,又称“访问类型”。
possible_keys:表示查询时,可能使用的索引
key:表示实际使用的索引
key_len:索引字段的长度
ref:列与索引的比较
rows:扫描出的行数(估算的行数)
filtered:按表条件过滤的行百分比
Extra:执行情况的描述和说明
挑选一些重要信息详细说明:
- select_type
SIMPLE 简单的select查询,查询中不包含子查询或者UNION
PRIMARY 查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY
SUBQUERY 在SELECT或WHERE列表中包含了子查询
DERIVED 在FROM列表中包含的子查询被标记为DERIVED(衍生),MySQL会递归执行这些子查询,把结果放在临时表中
UNION 若第二个SELECT出现在UNION之后,则被标记为UNION:若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
UNION RESULT 从UNION表获取结果的SELECT - type
mysql找到数据行的方式,效率排名
NULL > system > const > eq_ref > ref > range > index > all
***一般来说,得保证查询至少达到range级别,最好能达到ref。
system 表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计
const 通过索引一次就找到了,const用于比较primary key 和 unique key,因为只匹配一行数据,所以很快。如果将主键置于where列表中,mysql就能将该查询转换为一个常量
eq_ref 唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键索引和唯一索引 区别于const eq_ref用于联表查询的情况
ref 非唯一索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,他可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体
range 只检索给定范围的行,使用一个索引来选择行,一般是在where中出现between、<、>、in等查询,范围扫描好于全表扫描,因为他只需要开始于索引的某一点,而结束于另一点,不用扫描全部索引
index Full Index Scan,Index与All区别为index类型只遍历索引树。通常比All快,因为索引文件通常比数据文件小。也就是说,虽然all和index都是读全表,但是index是从索引中读取的,而all是从硬盘读取的
ALL Full Table Scan,将遍历全表以找到匹配的行
- possible_keys
指出mysql能使用哪个索引在表中找到记录,查询涉及到的字段若存在索引,则该索引被列出,但不一定被查询使用(该查询可以利用的索引,如果没有任何索引显示null)
实际使用的索引,如果为NULL,则没有使用索引。(可能原因包括没有建立索引或索引失效)
查询中若使用了覆盖索引(select 后要查询的字段刚好和创建的索引字段完全相同),则该索引仅出现在key列表中 possible_keys为null - key
key列显示mysql实际决定使用的索引,必然包含在possible_keys中。如果没有选择索引,键是NULL。想要强制使用或者忽视possible_keys列中的索引,在查询时指定FORCE INDEX、USE INDEX或者IGNORE index - key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。 - ref
显示索引的那一列被使用了,如果可能的话,最好是一个常数。哪些列或常量被用于查找索引列上的值。 - rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,也就是说,用的越少越好 - extra
包含不适合在其他列中显式但十分重要的额外信息
using filesort :表示mysql会对结果使用一个外部索引排序,而不是从表里按索引次序读到相关内容,可能在内存或磁盘上排序。mysql中无法利用索引完成的操作称为文件排序
using temporary: 使用了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。
以上两种信息表示mysql无法使用索引
Using Index:表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错。如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
Using where:不用读取表中所有信息,仅通过索引就可以获取所需数据,这发生在对表的全部的请求列都是同一个索引的部分的时候,表示mysql服务器将在存储引擎检索行后再进行过滤
Using temporary:表示MySQL需要使用临时表来存储结果集,常见于排序和分组查询,常见 group by ; order by
Using filesort:当Query中包含 order by 操作,而且无法利用索引完成的排序操作称为“文件排序”
Using join buffer:表明使用了连接缓存,比如说在查询的时候,多表join的次数非常多,那么将配置文件中的缓冲区的join buffer调大一些。
Impossible where:where子句的值总是false,不能用来获取任何元组
Select tables optimized away:这个值意味着仅通过使用索引,优化器可能仅从聚合函数结果中返回一行
No tables used:Query语句中使用from dual 或不含任何from子句
sql索引优化
索引的分类:聚簇索引,非聚簇索引,唯一索引,联合索引,覆盖索引
聚簇索引(又可以成为聚集索引):在Innodb引擎中主键使用聚集索引,聚集索引的主要特点是B+树的叶子节点不仅包含主键也包含数据列的所有信息。这样做的好处是找到主键索引的同时即可找到数据信息
非聚簇索引:区别于聚簇索引,非聚簇索引的叶子节点中只包含主键信息和数据指针(引用地址),相较于聚集索引还需要一次IO用来检索数据列信息。在MyIsam引擎中,无论主键索引还是其他索引,都是使用非聚集索引
唯一索引:建立唯一索引的数据列中值是唯一的,表中可以有多个唯一索引。主键本身也是唯一索引,不过两者是有本质区别的,最大的区别是一个表中只包含一个主键
联合索引:多个字段共同组成索引
覆盖索引:所要查找的数据列恰好都在索引中,仅需通过索引即可完成查找,效率较高
在实际操作过程中,应该选取表中哪些字段作为索引?
为了使索引的使用效率更高,在创建索引时,必须考虑在哪些字段上创建索引和创建什么类型的索引,有7大原则:
1.选择唯一性索引
2.为经常需要排序、分组和联合操作的字段建立索引
3.为常作为查询条件的字段建立索引
4.限制索引的数目
5.尽量使用数据量少的索引
6.尽量使用前缀来索引
7.删除不再使用或者很少使用的索引
8. 经常更新修改的字段不要建立索引(针对mysql说,因为字段更改同时索引就要重新建立,排序,而Orcale好像是有这样的机制字段值更改了,它不立刻建立索引,排序索引,而是根据更改个数,时间段去做平衡索引这件事的)
9、不推荐在同一列建多个索引
通过适当的建立索引,可以更好的提高查询速度,本篇文章不详细解释优化过程。