一、MySQL架构总览:
二、查询执行流程
一条select的生存周期:
流程:
1.连接
1.1客户端发起一条Query请求,监听客户端的‘连接管理模块’接收请求;
1.2将请求转发到‘连接进/线程模块’;
1.3调用‘用户模块’来进行授权检查;
1.4通过检查后,‘连接进/线程模块’从‘线程连接池’中取出空闲的被缓存的连接线程和客户端请求对接,如果失败则创建一个新的连接请求;
2.处理
2.1先查询缓存,检查Query语句是否完全匹配,接着再检查是否具有权限,都成功则直接取数据返回;
2.2上一步有失败则转交给‘命令解析器’,经过词法分析,语法分析后生成解析树;
2.3接下来是预处理阶段,处理解析器无法解决的语义,检查权限等,生成新的解析树;
2.4再转交给对应的模块处理;
2.5如果是SELECT查询还会经由‘查询优化器’做大量的优化,生成执行计划;
2.6模块收到请求后,通过‘访问控制模块’检查所连接的用户是否有访问目标表和目标字段的权限;
2.7有则调用‘表管理模块’,先是查看table cache中是否存在,有则直接对应的表和获取锁,否则重新打开表文件;
2.8根据表的meta数据,获取表的存储引擎类型等信息,通过接口调用对应的存储引擎处理;
2.9上述过程中产生数据变化的时候,若打开日志功能,则会记录到相应二进制日志文件中;
3.结果
3.1Query请求完成后,将结果集返回给‘连接进/线程模块’;
3.2返回的也可以是相应的状态标识,如成功或失败等;
3.3‘连接进/线程模块’进行后续的清理工作,并继续等待请求或断开与客户端的连接;
查询缓存(query cache)
在解析一个查询语句之前,如果查询缓存是打开的,那么MySQL会优先检查这个查询是否命中查询缓存中的数据。这个检查是通过一个对大小写敏感的哈希查找实现的。查询和缓存中的查询即使只有一个字节不同,那也不会匹配缓存结果,这种情况查询会进入下一个阶段的处理。
如果当前的查询恰好命中了查询缓存,那么在返回查询结果之前MySQL会检查一次用户权限。这仍然是无须解析查询SQL语句的,因为在查询缓存中已经存放了当前查询需要访问的表信息。如果权限没有问题,MySQL会跳过所有其他阶段,直接从缓存中拿到结果并返回给客户端。这种情况下,查询不会被解析,不用生成执行计划,不会被执行。
语法解析器和预处理器
首先,MySQL通过关键字将SQL语句进行解析,并生成一棵对应的“解析树”。MySQL解析器将使用MySQL语法规则验证和解析查询。例如,它将验证是否使用错误的关键字,或者使用关键字的顺序是否正确等,再或者它还会验证引号是否能前后正确的匹配。
预处理器则根据一些MySQL规则进一步检查解析树是否合法,例如,这里讲检查数据表和数据列是否存在,还会解析名字和别名,看看它们是否有歧义。
下一步预处理器会验证权限,这通常很快,除非服务器上有非常多的权限设置。
三、SQL解析顺序
SQL语句:
SELECT DISTINCT < select_list >FROM < left_table > < join_type >JOIN < right_table > ON < join_condition >WHERE < where_condition >GROUP BY < group_by_list >HAVING < having_condition >ORDER BY < order_by_condition >LIMIT < limit_number >
然而它的执行顺序是这样的:
FROM <left_table> ON <join_condition><join_type> JOIN <right_table>WHERE <where_condition>GROUP BY <group_by_list>HAVING <having_condition>SELECT DISTINCT <select_list>ORDER BY <order_by_condition>LIMIT <limit_number>
这里配上sql 解析图,很清晰: