pt-online-schema-change工具依赖于触发器的机制去实现表的无锁DDL。那我们试想在一主一从的情况下,有个大表需要执行DDL操作,为了验证该操作的执行时长,先用pt-online-schema-change工具在从库上执行变更。确认没有问题后再在主库上执行变更。当然,在执行之前是需要开启会话级的sql_log_bin=0以避免记录到binlog。

    但是我们从官方文档中获知如下:

    pt-online-schema-change的bug2_schema

    很明显,如果主从架构下,binlog的日志格式是row的话,依赖触发器机制的pt-online-schema-change是会造成数据丢失的。因为增量的数据无法通过触发器去收集。也就是说,在基于主库的binlog为row格式的情况下,从库的触发器是不会起作用的。因为主库本身通过触发器产生的变更已经写入binlog同步到从库。如果从库的触发器也生效的话,就会出现重复。

    总结:在基于主从复制架构下,如果主库binlog的日志格式为row情况下,pt-online-schema-change工具必须在主库执行才能避免主从数据不一致。如果日志格式是statement的话,则可以先在从库执行pt-online-schema-change再在主库执行。但是目前官方也建议参数binlog_format设置为row,而非statement,以避免某些情况下的主从数据不一致发生。