MySQL Server 主要有四种类型的日志——Error Log、General Query Log、Binary Log 和 Slow Query Log。

其中, Binlog 包含了一些事件,这些事件描述了数据库的改动,如建表、数据改动等,也包括一些潜在改动,比如 DELETE FROM tbs_test WHERE bing = ‘test_contition’ ,实际表中没有一条数据符合过滤条件,当然也就没有数据被删掉的情况,也会记录。除非使用 Row-based logging,否则会包含所有改动数据的 SQL Statement。

mysql Binlog 就有了两个重要的用途——复制和恢复。

显然,我们执行SELECT等不设计数据变更的语句是不会记录Binlog的,而涉及到数据更新则会记录。要注意的是,对支持事务的引擎如InnoDB而言,必须要提交了事务才会记录Binlog。Binlog是在事务最终commit前写入的,binlog什么时候刷新到磁盘跟参数sync_binlog相关。如果设置为0,则表示MySQL不控制binlog的刷新,由文件系统去控制它缓存的刷新,而如果设置为不为0的值则表示每sync_binlog次事务,MySQL调用文件系统的刷新操作刷新binlog到磁盘中。设为1是最安全的,在系统故障时最多丢失一个事务的更新,但是会对性能有所影响,一般情况下会设置为100或者0,牺牲一定的一致性来获取更好的性能。

开启和停用Binlog
通过配置/etc/my.cnf配置文件的log-bin选项:

[mysqld]
log-bin=mysql-bin

这个需要重启MySQL服务。
可以使用SET SQL_LOG_BIN=0命令停止使用日志文件,然后可以通过SET SQL_LOG_BIN=1命令来启用。

Binlog如何删除

show variables like 'expire_log_days';
set global expire_log_days=3; --单位为天
reset master; --删除master的binlog
reset slave; --删除slave的relay log
purge master logs before '2021-09-14 08:03:00'; --删除指定日期前的日志索引中的binlog日志文件
purge master logs to 'binlog.000110';

注意:也可以采用操作系统的本地命令删除文件。

Binlog文件的扩展
当遇到以下3种情况时会重新生成一个新的日志文件,文件序号递增:

MySQL服务器停止或重启时,MySQL会在重启时生成一个新的日志文件;
使用flush logs命令;
当binlog文件大小超过max_binlog_size系统变量配置的上限时;

PS:

binlog文件的最大值和默认值是1GB,该设置并不能严格控制binlog的大小,尤其是binlog比较靠近最大值而又遇到一个比较大事务时,为了保证事务的完整性,不可能做切换日志的动作,只能将该事务的所有SQL都记录到当前日志,直到事务结束。

Binlog的日志格式
binlog有三种格式:Statement, Row, Mixed.

1. 基于SQL语句的复制(statement-based replication, SBR)
2. 基于行的复制(row-based replication, RBR)
3. 混合模式复制(mixed-based replication, MBR)

如下分别介绍之。

Statement

每一条会修改数据的sql都会记录在binlog中。

优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO, 提高了性能。

缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行的时候相同的结果。另外mysql的复制,像一些特定函数的功能,slave可与master上要保持一致会有很多相关问题。

提示:
相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小鱼statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,row格式会产生大量日志,因此在考虑是否使用row格式日志时应该根据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。

Row格式

5.1.5版本的MySQL才开始支持row level的复制,它不记录sql语句上下文相关信息,仅保存哪条记录被修改。

优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以row的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题.

缺点:
所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容。

新版本MySQL中对row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录,如果sql语句确实就是update或者delete等修改数据的语句,那么还是会记录所有行的变更。

Mixed格式

从5.1.8版本开始,MySQL提供了Mixed格式,实际就是Statement与Row的结合。
在Mixed模式下,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种。