南大通用GBase 8c系统视图分析SQL执行时间

原创

mb66ea571b9130a 2024-09-18 13:24:07 博主文章分类：国产数据库 ©著作权

©著作权归作者所有：来自51CTO博客作者mb66ea571b9130a的原创作品，请联系作者获取转载授权，否则将追究法律责任

南大通用GBase 8c是一款多模多态数据库，支持主备式、分布式部署方式。对于故障和性能分析，内部提供丰富的工具和系统表或系统视图支撑实现。本文将介绍如何通过dbe_perf.statement系统视图分析SQL执行时间。

1、概述

dbe_perf.statement 实际上是一个视图，这个视图实际执行的是 get_instr_unique_sql() 内置函数，能够显示分布式CN节点或者主备式主DN节点上执行过的SQL语句的部分时间信息，比如SQL执行总耗时、执行器中的耗时、优化器中执行的耗时等。

它只能在CN或者主备式主节点上执行，不能在备DN上执行。

内置函数get_instr_unique_sql()的数据来自于 g_instance.stat_cxt.UniqueSQLHashtbl 哈希表。哈希表内存有限，所以不能保存所有的sql信息，通过配置 instr_unique_sql_count GUC参数（默认值是 100）可以调整 dbe_perf.statement 能够记录的sql的数据。节点重启后，g_instance.stat_cxt.UniqueSQLHashtbl 哈希表内容会被清空。

2、示例

下面的示例展示了benchmarksql测试中 UPDATE bmsql_warehouse SET w_ytd = w_ytd + $1 WHERE w_id = $2 语句的统计信息。

test=# select * from dbe_perf.statement where query ~ 'UPDATE bmsql_warehouse';

执行结果如下：

[ RECORD 1 ]
--------+----------------------------------------------------------------------
node_name            | cn1
node_id              | -1178713634
user_name            | test1
user_id              | 16974
unique_sql_id        | 739002000
query                | UPDATE bmsql_warehouse     SET w_ytd = w_ytd + $1     WHERE w_id = $2
n_calls              | 9339
min_elapse_time      | 150
max_elapse_time      | 26529
total_elapse_time    | 2512361
n_returned_rows      | 0
n_tuples_fetched     | 0
n_tuples_returned    | 0
n_tuples_inserted    | 0
n_tuples_updated     | 0
n_tuples_deleted     | 0
n_blocks_fetched     | 1
n_blocks_hit         | 1
n_soft_parse         | 0
n_hard_parse         | 0
db_time              | 2929210
CPU_time             | 906947
execution_time       | 0
parse_time           | 24
plan_time            | 0
rewrite_time         | 9
pl_execution_time    | 0
pl_compilation_time  | 0
data_io_time         | 0
net_send_info        | {"time":215081， "n_calls":28017， "size":1285855}
net_recv_info        | {"time":1385396， "n_calls":26612， "size":884261}
net_stream_send_info | {"time":0， "n_calls":0， "size":0}
net_stream_recv_info | {"time":0， "n_calls":0， "size":0}
last_updated         | 2022-12-12 13:51:59.767953+08
sort_count           | 0
sort_time            | 0
sort_mem_used        | 0
sort_spill_count     | 0
sort_spill_size      | 0
hash_count           | 0
hash_time            | 0
hash_mem_used        | 0
hash_spill_count     | 0
hash_spill_size      | 0

通过返回信息，可得知：

在测试的这段时间这条sql执行了 9339次。
每次执行的时间是 db_time / n_calls = 313us 实际消耗CPU的时间 CPU_time / n_calls = 97us。
这条sql走lightproxy，所以 plan_time rewrite_time execution_time 都是0。

3、字段解析

n_calls

表示这个sql执行的次数，下面的时间都是总的时间，如果要计算平均时间需要除以 n_calls。

db_time

表示这个sql 执行的总时间，用这个时间除以 n_calls 就是每条sql执行的平均时间。这个时间的计时从 ReadCommand 接收到 client的消息开始 (timeInfoRecordStart)，到给client 发给 ReadyForQuery消息结束 (timeInfoRecordEnd)。

CPU_time

这个时间和db_time 的计时类似，和db_time 不同的是，它调用的是 clock_gettime(CLOCK_THREAD_CPUTIME_ID， &tv) API，也就是只计算CPU时间，不计算在内核中sleep的时间。

parse_time

统计的是pg_parse_query 函数内生成查询数的时间。

plan_time

统计的是 planner 函数优化器生成执行计划的时间。

rewrite_time

统计的是 pg_rewrite_query 函数内查询重写的时间。

execution_time

统计的是 PortalRun 函数内执行器消耗的时间。

data_io_time

统计的是读取表的block的时间，因为CN上只有元数据，所以这个值很小。

net_send_info

统计的是CN向DN发送执行计划或者下推的sql而调用 com_send的次数，消耗的时间，发送数据量的大小。

net_recv_info

同net_send_info 统计的是CN调用 com_recv的次数，消耗的时间，接收数据的大小。

4、清除统计信息

如果想清空统计信息，重新开始统计，可调用 reset_unique_sql 内置函数。

reset_unique_sql 有三个入参：第一个入参可选 global 或 local，表示清除全局的或者本地的 sql。第二个参数是 cleanType 用 all 即可，第三个参数 cleanValue 用0 即可。

调用完后再查视图就会发现内容已清空。

test=# select reset_unique_sql('local'， 'all'， 0);
-[ RECORD 1 ]----+--
reset_unique_sql | t
test=# select * from dbe_perf.statement where query ~ 'UPDATE bmsql_warehouse';
(No rows)
test=#

以上就是通过系统视图查看SQL执行时间的方法。