在性能分析中,SQL的分析那是必须的。
不同的库又有着不同的命令,但是总体来说,同一类型的数据库,除了有一些手段上的不同之外,给出的结果基本上都是类似的。
今天说一下mysql的。
每次我在培训的时候都会说,对数据库的性能分析来说,就是要知道一个SQL在数据库中执行得有多快。从进到数据库,到出数据库,需要多长时间。
对mysql来说,分析sql的执行时间有几种方法。比如说:
1. 执行计划:
从执行计划中可以看到走没走索引,key的长度,取了多少行数据,使用的条件之类的。这是个最基本的在数据库里看sql的性能的了,但是这个信息相对oracle里的执行计划,那真是差太多了。所以我们也就是用它随便看看,不用过于依赖,不然只能伤自己。
2. query stats
在mysqlworkbench里有这么个tab,可以看查询的状态,在这里面我们可以看到了更多的东西,就是有了joins和sort、index usage之类的信息。但是感觉还是不够劲。不够深入。
3. profiling
set profiling=1;
show profiles;
show profile all for query <ID>;
这下开心了。终于可以看到更深入的信息了,在这里可以看到一个sql从初级化开始到cleaningup整个过程中每一步消耗的时间,以及使用的cpu、memory、io、cs等等的信息。只要看不懂的,没有看不到的。
那如何有一堆的sql要分析怎么办?
4. mysqldumpslow和pt-query-digest
mysqldumpslow -s t -t 10 slow.log.last
按时间排个序,取前10。一个个SQL就自己出来站好了。(其他好用的参数请看命令的help)
下面看看pt-query-digest能做什么。
对整个slowlog进行分析,把exec time/lock time/rows sent/rows examine/rows affecte/query size分别整理出来,有total值,还有最大、最小、平均、95%、标准方差、中位值。
第二部分中,对每个sql进行排序,按执行时间。这里不仅有执行时间、还有执行次数、每次执行响应时间、和方差均值比。顿觉方向不再迷茫了。后续分析有了方向。
下面会把每一个sql列出来,并分析时间的消耗。
(有看官问了,你这怎么有码呢?我笑而不语,有身份证的人都懂得。)
不过不影响接着说思路。从这里可以看到每个语句的count/lock time/rows sent/rows examine/rows affecte/query size,并且这里还有percentage了。按性能从最严重的地方开始收拾的原则,我们基本上不用再想其他的了。
有了这个慢sql的分析,再结合前面提到的profiling。
因为mysqldumpslow是mysql自带的工具,所以建议先用那个。也有人说了,现在mysql有一抓一大把的工具可以监控,说到sql就到sql,为啥还要会这些呢?是呀,为啥呢?
其实不为啥,就是哥喜欢。
不管用什么工具,最重要的是你要达到什么目的。不管是架构级分析、系统级分析、DB级分析、网络级分析、应用级分析、代码级分析,你到底是想实现什么目的,工具并不重要。