基础材料:
centos7.5 mysql 5.7.24 开启GTID ROW格式
binlog对于mysql是至关重要的,binlog与undo redo一起保证了数据的完整性,用于数据恢复,崩溃恢复、任一时间点恢复、甚至是任意一条数据的恢复。所有的高可用模式也都是基于binlog进行处理的。
本文主要对row格式下binlog日志输出内容进行说明。
首先执行flush logs截断当前日志,生成新日志,便于查看。然后插入一条记录,使用mysqlbinlog命令查看binlog。
mysql> flush logs;
mysql> insert into testxxxx values (110,111,111);
[root@mysql1 ~]# mysqlbinlog --no-defaults -vv mysql-binlog.000003
# at 732
#190312 16:23:46 server id 98 end_log_pos 797 CRC32 0xba637854 GTID last_committed=2 sequence_number=3 rbr_only=yes
/*!50718 SET TRANSACTION ISOLATION LEVEL READ COMMITTED*//*!*/;
SET @@SESSION.GTID_NEXT= '92b47a33-db57-11e8-accf-000c2988a781:21'/*!*/;
# at 797
#190312 16:23:46 server id 98 end_log_pos 869 CRC32 0x82827bcc Query thread_id=48 exec_time=0 error_code=0
SET TIMESTAMP=1552379026/*!*/;
BEGIN
/*!*/;
# at 869
#190312 16:23:46 server id 98 end_log_pos 922 CRC32 0x28c80e4b Table_map: `test`.`testxxxx` mapped to number 185
# at 922
#190312 16:23:46 server id 98 end_log_pos 970 CRC32 0x9d58cf96 Write_rows: table id 185 flags: STMT_END_F
BINLOG '
kmyHXBNiAAAANQAAAJoDAAAAALkAAAAAAAEABHRlc3QACHRlc3R4eHh4AAMDAwMABksOyCg=
kmyHXB5iAAAAMAAAAMoDAAAAALkAAAAAAAEAAgAD//huAAAAbwAAAG8AAACWz1id
'/*!*/;
### INSERT INTO `test`.`testxxxx`
### SET
### @1=110 /* INT meta=0 nullable=0 is_null=0 */
### @2=111 /* INT meta=0 nullable=1 is_null=0 */
### @3=111 /* INT meta=0 nullable=1 is_null=0 */
# at 970
#190312 16:23:46 server id 98 end_log_pos 1001 CRC32 0xa52db5f9 Xid = 2932378
COMMIT/*!*/;
# at 1001
1、上图中有许多# at开头的行,用于标示每个事件在binlog中的偏移量,例如# at 732表示该事件在binlog的位置是732字节之后
两个# at之间标示了mysql中的一个事件,而且在事件开始时也会通过end_log_pos标示事件结束的位置
binlog中一个完整的事务对应多个事件,两个GTID last_committed=2 sequence_number=3这样的行之间标识了一个完整的事务。
2、 server id 98表示产生该事务服务器id号为98,这是在my.cnf文件中定义的,该id在集群内不能重复。一来是对事务产生的server做标识,二来是在类似双主模式下的集群环境里用于中断binlog循环复制重做的问题(log-slave-updates = 1)。
3、 CRC32用于校验binlog文件的完整性。
4、 GTID表示启动了GTID属性
5、 last_committed=2组提交标识、同一组提交的事务具备相同的last_committed值,可以在从库并行重放,以减少同步延迟。
6、 sequence_number=3,事务对应的顺序号,该值单调递增,同时也标识了同一组提交事务的顺序,在从库设置slave_preserve_commit_order=1时,依赖该值模拟主库的提交顺序,在从库提交。以达到数据落盘过程完全一致。
7、 SET @@SESSION.GTID_NEXT= '92b47a33-db57-11e8-accf-000c2988a781:21'/*!*/;标识该事务使用的GTID序列号,92b47a33-db57-11e8-accf-000c2988a781为该主机的标识。后面的数字21标识事务号,随事务的提交而依次递增。该GTID标识正常情况下与show master status或show slave status的输出部分一致。
8、 SET TIMESTAMP=1552379026/*!*/;标识了该事务产生的时间,在一些特殊情况下保证数据一致性。比如使用了now函数的sql,可能延迟了很长时间才传到备库,此时now函数取该值插入,保证了与主库执行时间的一致。
9、 begin开始执行事务
10、Table_map: `test`.`testxxxx` mapped to number 185,标识要操作哪个库的哪张表
11、Write_rows: table id 185 flags: STMT_END_F,标识该操作类型,本次是插入操作对应Write_rows事件
12、
### INSERT INTO `test`.`testxxxx`
### SET
### @1=110 /* INT meta=0 nullable=0 is_null=0 */
### @2=111 /* INT meta=0 nullable=1 is_null=0 */
### @3=111 /* INT meta=0 nullable=1 is_null=0 */
这部分是具体的插入语句,@1=110表示在该表的第一个列插入值110,依次类推。如果此处是一个误删除操作,只要把前面的delete改为insert,再前滚这段binlog即可找回数据。由于语句执行时还有上下文关系,所以在不确定影响的情况下,不要只把SQL拿出来执行,而是前滚整个事务。
13、Xid = 2932378是保证数据完整性的一个标识,每个DML事务提交并完全写入binlog中结尾处一定会有Xid(DDL是没有的)。在redolog中也会记录该Xid值。在2PC提交机制中用此标识在redolog和binlog进行对比,崩溃时如果redolog没有commit,在redolog和binlog都有该值时,则事务重做,如果binlog没有找到该值时,则事务回滚。如果redolog也没有该值时,无需查找binlog,事务直接回滚。
14、最后由COMMIT标识提交事务