背景

早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求。不过早期的数据库同步业务,主要是基于trigger的方式获取增量变更,不过从2010年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务,从此开启了一段新纪元。

ps. 目前内部版本已经支持mysql和oracle部分版本的日志解析,当前的canal开源版本支持5.7及以下的版本(阿里内部mysql 5.7.13, 5.6.10, mysql 5.5.18和5.1.40/48)

 

基于日志增量订阅&消费支持的业务:

  1. 数据库镜像
  2. 数据库实时备份
  3. 多级索引 (卖家和买家各自分库索引)
  4. search build
  5. 业务cache刷新
  6. 价格变化等重要业务消息

项目介绍

名称:canal [kə'næl]

译意: 水道/管道/沟渠

语言: 纯java开发

定位: 基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了mysql

关键词: mysql binlog parser / real-time / queue&topic

 

工作原理

mysql主备复制实现

​​​从上层来看,复制分成三步:

  1. master将改变记录到二进制日志(binary log)中(这些记录叫做二进制日志事件,binary log events,可以通过show binlog events进行查看);
  2. slave将master的binary log events拷贝到它的中继日志(relay log);
  3. slave重做中继日志中的事件,将改变反映它自己的数据。

canal的工作原理:

mysql-elastic search    canal_数据库

原理相对比较简单:

  1. canal模拟mysql slave的交互协议,伪装自己为mysql slave,向mysql master发送dump协议
  2. mysql master收到dump请求,开始推送binary log给slave(也就是canal)
  3. canal解析binary log对象(原始为byte流)

重要版本更新说明

canal 1.1.x系列,参考release文档:​​版本发布信息​

  1. 整体性能测试&优化,提升了150%. #726 参考: 【​​Performance​​】
  2. 原生支持prometheus监控 #765 【​​Prometheus QuickStart​​】
  3. 原生支持kafka消息投递 #695 【​​Canal Kafka QuickStart​​】
  4. 原生支持aliyun rds的binlog订阅 (解决自动主备切换/oss binlog离线解析) 参考: 【​​Aliyun RDS QuickStart​​】
  5. 原生支持docker镜像 #801 参考: 【​​Docker QuickStart​​】

相关文档

See the wiki page for : ​​wiki文档​

wiki文档列表

多语言业务

  1. canal整体交互协议设计上使用了protobuf3.0,理论上可以支持绝大部分的多语言场景,欢迎大家提交多客户端的PR
  1. canal作为MySQL binlog的增量获取工具,可以将数据投递到MQ系统中,比如Kafka/RocketMQ,可以借助于MQ的多语言能力

相关资料

相关开源

  1. 阿里巴巴分布式数据库同步系统(解决中美异地机房):​​http://github.com/alibaba/otter​
  2. 阿里巴巴去Oracle数据迁移同步工具(目标支持MySQL/DRDS):​​http://github.com/alibaba/yugong​

相关产品

  1. ​阿里云分布式数据库DRDS​
  2. ​阿里云数据传输服务DTS​
  3. ​阿里云数据库备份服务DBS​
  4. ​阿里云数据管理服务DMS​

问题反馈

    1. 新浪微博: agapple0002
    2. 报告issue:​​issues​

    ​https://github.com/alibaba/canal​