目录

如何判断一个数据库是否出问题?

select 1判断 

查表判断

更新判断

内部统计


在一主一备的双M架构里,主备切换只需要把客户端流量切换到备库;

而在一主多从架构里,主备切换除了要把客户端流量切到备库外,还需要把从库连接到新主库上。

主备切换有两种场景,一种是主动切换,一种是被动切换。而其中被动切换,往往是因为主库出问题了,由HA系统发起的。

 


如何判断一个数据库是否出问题?

select 1判断 

select 1 成功返回,只能说明这个库的经进程,并不能说明主库没问题。

这里需要明确并发连接并发查询的区别:

show processlist,看到的几千个链接,指的就是并发连接;而“当前正在执行”的语句,才是并发查询。

并发连接数达到几千个影响并不大,就是多占用一些内存而已,应该关注的是并发查询,因为并发查询太高才是CPU杀手。这也是为什么需要设置innodb_thread_concurrency参数的原因。

 

查表判断

为了能够检测InnoDB并发线程数过多导致的系统不可用情况,需要找一个访问InnoDB的场景,一般的做法是,在系统库里创建一个表,比如命名为health_check,里面只放一行数据,然后定期执行。

使用这个方法,可以检测出由于并发线程过多导致的数据库不可用的情况;

但空间满了以后,这种方法又会变得不好使了。

我们知道,更新食物要写binlog,而一旦binlog所在磁盘的空间占用率达到100%,那么所有的更新语句和事物提交的commit语句就都会被堵住,但是系统这时候是可以正常读数据的。

 

更新判断

通常做法是放一个timestamp字段,用来表示最后一次执行检测的时间:
mysql> update mysql.health_check set t_modified=now();

 

节点可用性的检测都应该包含主库和备库。如果用更新来检测主库的话,那么备库也要进行更新检测。但,悲苦的检测也是要写binlog的,所以表就不能只有一行数据了。

为了让主备之间的更新不产生冲突,在表上存入多行数据,并用A\B的server_id做主键

mysql> CREATE TABLE `health_check` (  `id` int(11) NOT NULL,  `t_modified` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,  PRIMARY KEY (`id`)) ENGINE=InnoDB;
/* 检测命令 */
insert into mysql.health_check(id, t_modified) values (@@server_id, now()) on duplicate key update t_modified=now();

内部统计

针对磁盘利用率这个问题,如果MySQL可以告诉我们,内部每一次IO请求的时间,那判断数据库是否出问题的方法就可靠得多了。