TiDB数据库运维之系统表的使用

  • 系统表的存放位置
  • TiDB常用集群信息系统表
  • mysql数据库
  • information_schema数据库
  • information_schema.cluster_info
  • information_schema.cluster_config
  • information_schema.ddl_jobs
  • 运维常用系统表查询
  • 系统慢日志查询
  • 系统读写热点查询
  • SQL阻塞查询
  • DATA_LOCK_WAITS
  • DEADLOCKS
  • TIDB_TRX


系统表的存放位置

  • mysql存储TiDB系统表,如mysql.user等;
  • information_schema查看系统元数据:
  • 与MySQL兼容的表,如tablesprocesslistcolumns等;
  • 自定义的表,如cluster_configcluster_hardwaretiflash_replica等;
  • metrics_schema是基于Prometheus中TiDB监控指标的一组视图;
  • performance_schema目前为了与MySQL兼容保留了大部分视图。

TiDB常用集群信息系统表

mysql数据库

下面的表中记录了用户账户以及相应的授权信息:

  • mysql.user:用户账户、全局权限、以及其他一些非权限的列;
  • mysql.db:数据库级别的权限;
  • mysql.tables_priv:表级别的权限;
  • mysql.columns_priv:列级别的权限(TiDB v5.3及之前版本不支持)。

mysql库中的其他重要系统表还包括:

  • mysql.GLOBAL_VARIABLES:存储了TiDB的全局变量,支持对系统表中VARIABLE_VALUE的修改;
  • mysql.tidb:以Key-Value形式存储了集群状态,通过修改VARIABLE_VALUE可以调整相关系统行为。

information_schema数据库

information_schema.cluster_info

系统表information_schema.cluster_info提供了集群当前的拓扑信息、各个节点的版本信息、版本对应的Git Hash、各节点的启动时间、各实例的运行时间。当集群进行升级或者打了Patch版本,确定各组件版本是否打好时,可以查询此表。

  • version: 对应节点的语义版本号;
  • start_time:对应节点的启动时间;
  • uptime:对应节点已经运行的时间。

information_schema.cluster_config

系统表information_schema.cluster_config用于获取集群当前所有组件实例的配置信息。TiDB v4.0后引入该系统表提高了易用性。

  • type:节点类型,可以为tidb、pd或tikv;
  • instance:节点的服务地址;
  • key:配置项名称;
  • value:配置项的值。

information_schema.ddl_jobs

系统表information_schema.ddl_jobsadmin show ddl jobs命令提供了一个information_schema接口,方便我们通过SQL查询和过滤相关表近期的DDL变更情况。

运维常用系统表查询

系统慢日志查询

慢日志查询主要用到了information_schema中的slow_query系统表。

场景一:搜索某个用户的Top N慢查询

select query_time, query, user
from information_schema.slow_query
where is_internal=false       -- 排除TiDB内存的慢查询
and user = "username"
order by query_time desc limit 3;

场景二:根据SQL指纹digest)搜索同类慢查询

  1. 先根据最近慢语句List查找特定慢SQL:
select query_time, query, digest
from information_schema.slow_query
where is_internal=false
and time between '2021-09-01' and '2021-09-02'
order by query_time desc limit 1;
  1. 再根据SQL指纹搜索同类慢查询:
select query_time, query, digest
from information_schema.slow_query
where digest="476dnxmjsagsjajk20djsui92";

:SQL指纹指将一条SQL中的字面值替换成其他固定符号。可以用来做SQL脱敏或者SQL归类。

select * from t1 where id = ?;

场景三:搜索统计信息为pseudo的慢SQL

select query, query_time, stats
from information_schema.slow_query
where is_internal=false
and stats like '%pseudo%';

: 如果慢查询日志中的统计信息被标记为pseudo,往往说明TiDB表的统计信息更新不及时,需要运行analyze table手动收集统计信息。

系统读写热点查询

读写热点查询主要用到了information_schema中的tidb_hot_regionstikv_region_peers系统表。

场景一:查询当前读写热点表

select db_name, table_name, index_name,
       type,   -- 读写热点分类
       sum(FLOW_BYTES),   -- 每分钟流量
       count(1),
       group_concat(h.region_id),
       count(DISTINCT p.store_id),
       group_concat(p.store_id)
from TIDB_HOT_REGIONS h
join TIKV_REGION_PEERS p 
on h.region_id = p.region_id
and p.IS_LEADER = 1
group by db_name, table_name, index_name, type;

场景二:统计当前读写热点Store

select p.store_id, 
       sum(FLOW_BYTES),   -- store总流量
       count(1)           -- region数量
from TIDB_HOT_REGIONS h
join TIKV_REGION_PEERS p 
on h.region_id = p.region_id
and p.IS_LEADER = 1
group by p.store_id
order by 2 desc;

SQL阻塞查询

TiDB v5.2 information_schema中新增了以下几个跟锁和阻塞相关的视图。

DATA_LOCK_WAITS

  • 集群上所有TiKV节点上当前正在发生的悲观锁等待;
  • 仅拥有PROCESS权限的用户可以查询;
  • 从所有TiKV节点实时获取;
  • 如果集群规模很大、负载很高,查看该表时有造成性能抖动的潜在风险。

DEADLOCKS

  • 提供当前TiDB节点上最近发生的若干次死锁错误的信息;
  • 默认容纳最近10次死锁错误的信息。

死锁问题排查:

select * from information_schema.deadlocks;

TIDB_TRX

  • 返回了当前所有TiDB上正在执行的事务信息;
  • 仅拥有PROCESS权限的用户可以查询。