Canal是一个很好的数据库同步工具。Canal是阿里巴巴旗下的一款开源项目,纯java开发。基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了MySQL(源端),目标端支持各种中间价及数据库。
2、工作原理Canal的工作原理就是把自己伪装成MySQL slave,模拟MySQL slave的交互协议向MySQL Mater发送 dump协议,MySQL mater收到canal发送过来的dump请求,开始推送binary log给Canal,然后Canal解析binary log,再发送到存储目的地,比如MySQL,Kafka,Elastic Search等等。
注意:canal的数据同步不是全量的,而是增量的
canal的原理是基于mysql binlog技术,所以这里一定需要开启mysql的binlog写入功能。
开启mysql服务: service mysql start
(1)检查binlog功能是否有开启
mysql> show variables like 'log_bin'; +---------------+-------+ | Variable_name | Value | +---------------+-------+ | log_bin | OFF | +---------------+-------+ 7 1 row in set (0.00 sec)
(2)如果显示状态为OFF表示该功能未开启,开启binlog功能
① 修改 mysql 的配置文件 my.cnf
vi /etc/my.cnf
追加内容:
log-bin=mysql-bin #binlog文件名
binlog_format=ROW #选择row模式
server_id=1 #mysql实例id,不能和canal的slaveId重复
② 重启 mysql:
service mysql restart
(3)登录 mysql 客户端,查看 log_bin 变量
mysql> show variables like 'log_bin'; +---------------+-------+ | Variable_name | Value | +---------------+-------+ | log_bin | OFF | +---------------+-------+ 7 1 row in set (0.00 sec)
如果显示状态为ON表示该功能已开启
(4)在mysql里面添加以下的相关用户和权限
CREATE USER ‘root’@’%’ IDENTIFIED BY ‘root1’;
GRANT SHOW VIEW, SELECt, REPLICATION SLAVE, REPLICATION CLIENT ON . TO ‘root’@’%’;
(4)刷新一下
FLUSH PRIVILEGES;
注意有个坑:
mysql8.0 引入了新特性 caching_sha2_password;这种密码加密方式客户端不支持;客户端支持的加密方式是mysql_native_password 。
mysql> select host,user,plugin from user; +-----------+------------------+-----------------------+ | host | user | plugin | +-----------+------------------+-----------------------+ | % | root | caching_sha2_password | | localhost | mysql.infoschema | caching_sha2_password | | localhost | mysql.session | caching_sha2_password | | localhost | mysql.sys | caching_sha2_password | | localhost | root | caching_sha2_password | +-----------+------------------+-----------------------+
可以使用命令将他修改成mysql_native_password加密模式
mysql> update user set plugin='mysql_native_password' where user='root'; Query OK, 2 rows affected (0.01 sec) Rows matched: 2 Changed: 2 Warnings: 0 mysql> select host,user,plugin from user; +-----------+------------------+-----------------------+ | host | user | plugin | +-----------+------------------+-----------------------+ | % | root | mysql_native_password | | localhost | mysql.infoschema | caching_sha2_password | | localhost | mysql.session | caching_sha2_password | | localhost | mysql.sys | caching_sha2_password | | localhost | root | mysql_native_password | +-----------+------------------+-----------------------+ 5 rows in set (0.00 sec)4、下载安装Canal服务
下载地址:
https://github.com/alibaba/canal/releases
(1)下载之后,放到目录中,解压文件
cd /usr/local/canal
canal.deployer-1.1.4.tar.gz
tar -zxvf canal.deployer-1.1.4.tar.gz
(2)修改配置文件
vi conf/example/instance.properties
#需要改成数据源mysql数据库的信息 canal.instance.master.address=47.99.134.106:3306 #需要改成自己的数据库用户名与密码 canal.instance.dbUsername=root canal.instance.dbPassword=root1 #需要改成同步的数据库表规则 canal.instance.filter.regex=.*\..*
注:
mysql 数据解析关注的表,Perl正则表达式.
多个正则之间以逗号(,)分隔,转义符需要双斜杠()
常见例子:
- 所有表:.* or .…
- canal schema下所有表: canal…*
- canal下的以canal打头的表:canal.canal.*
- canal schema下的一张表:canal.test1
- 多个规则组合使用:canal…*,mysql.test1,mysql.test2 (逗号分隔)
注意:此过滤条件只针对row模式的数据有效(ps. mixed/statement因为不解析sql,所以无法准确提
取tableName进行过滤)
(3)进入bin目录下启动
sh bin/startup.sh
(1)pom.xml文件
org.springframework.boot spring-boot-starter-webmysql mysql-connector-javacommons-dbutils commons-dbutilsorg.springframework.boot spring-boot-starter-jdbccom.alibaba.otter canal.client
(2)CanalClient
@Component public class CanalClient { //sql队列 private QueueSQL_QUEUE = new ConcurrentlinkedQueue<>(); @Resource private DataSource dataSource; public void run() { //canal默认端口号11111 // 创建链接 //Canal安装的主机 CanalConnector connector = CanalConnectors.newSingleConnector(new InetSocketAddress("47.99.134.106", 11111), "example", "", ""); int batchSize = 1000; try { //打开连接 connector.connect(); //订阅数据库表,全部表 connector.subscribe(".*\..*"); //回滚到未进行ack的地方,下次fetch的时候,可以从最后一个没有ack的地方开始拿 connector.rollback(); try { while (true) { //尝试从master那边拉去数据batchSize条记录,有多少取多少 // 获取指定数量的数据 Message message = connector.getWithoutAck(batchSize); //获取批量ID long batchId = message.getId(); //获取批量的数量 int size = message.getEntries().size(); //当size不为0的时候,执行 //如果没有数据 if (batchId == -1 || size == 0) { //线程休眠1秒 Thread.sleep(1000); } else { //如果有数据,处理数据 dataHandle(message.getEntries()); } //进行 batch id 的确认。确认之后,小于等于此 batchId 的 Message 都会被确认。 connector.ack(batchId); //当队列里面堆积的sql大于一定数值的时候就模拟执行(大于1的时候) if (SQL_QUEUE.size() >= 1) { executeQueueSql(); } } } catch (InterruptedException e) { e.printStackTrace(); } catch (InvalidProtocolBufferException e) { e.printStackTrace(); } } finally { connector.disconnect(); } } public void executeQueueSql() { int size = SQL_QUEUE.size(); for (int i = 0; i < size; i++) { String sql = SQL_QUEUE.poll(); System.out.println("[sql]----> " + sql); this.execute(sql.toString()); } } private void dataHandle(List entrys) throws InvalidProtocolBufferException { for (Entry entry : entrys) { if (EntryType.ROWDATA == entry.getEntryType()) { RowChange rowChange = RowChange.parseFrom(entry.getStorevalue()); EventType eventType = rowChange.getEventType(); // *** 作都是通过拼接sql语句得到的 //删除 *** 作 if (eventType == EventType.DELETe) { saveDeleteSql(entry); //更新 *** 作 } else if (eventType == EventType.UPDATE) { saveUpdateSql(entry); //插入 *** 作 } else if (eventType == EventType.INSERT) { saveInsertSql(entry); } } } } private void saveUpdateSql(Entry entry) { try { RowChange rowChange = RowChange.parseFrom(entry.getStorevalue()); List rowDatasList = rowChange.getRowDatasList(); for (RowData rowdata: rowDatasList) { List newColumnList = rowData.getAfterColumnsList(); StringBuffer sql = new StringBuffer("update " + entry.getHeader().getTableName() + " set "); for (int i = 0; i < newColumnList.size(); i++) { sql.append(" " + newColumnList.get(i).getName() + " = '" + newColumnList.get(i).getValue() + "'"); if (i != newColumnList.size() - 1) { sql.append(","); } } sql.append(" where "); List oldColumnList = rowData.getBeforeColumnsList(); for (Column column : oldColumnList) { if (column.getIsKey()) { //暂时只支持单一主键 sql.append(column.getName() + "=" + column.getValue()); break; } } //把sql语句存到队列里 SQL_QUEUE.add(sql.toString()); } } catch (InvalidProtocolBufferException e) { e.printStackTrace(); } } private void saveDeleteSql(Entry entry) { try { RowChange rowChange = RowChange.parseFrom(entry.getStorevalue()); List rowDatasList = rowChange.getRowDatasList(); for (RowData rowdata: rowDatasList) { List columnList = rowData.getBeforeColumnsList(); StringBuffer sql = new StringBuffer("delete from " + entry.getHeader().getTableName() + " where "); for (Column column : columnList) { if (column.getIsKey()) { //暂时只支持单一主键 sql.append(column.getName() + "=" + column.getValue()); break; } } SQL_QUEUE.add(sql.toString()); } } catch (InvalidProtocolBufferException e) { e.printStackTrace(); } } private void saveInsertSql(Entry entry) { try { RowChange rowChange = RowChange.parseFrom(entry.getStorevalue()); List rowDatasList = rowChange.getRowDatasList(); for (RowData rowdata: rowDatasList) { List columnList = rowData.getAfterColumnsList(); StringBuffer sql = new StringBuffer("insert into " + entry.getHeader().getTableName() + " ("); for (int i = 0; i < columnList.size(); i++) { sql.append(columnList.get(i).getName()); if (i != columnList.size() - 1) { sql.append(","); } } sql.append(") VALUES ("); for (int i = 0; i < columnList.size(); i++) { sql.append("'" + columnList.get(i).getValue() + "'"); if (i != columnList.size() - 1) { sql.append(","); } } sql.append(")"); SQL_QUEUE.add(sql.toString()); } } catch (InvalidProtocolBufferException e) { e.printStackTrace(); } } public void execute(String sql) { Connection con = null; try { if(null == sql) return; con = dataSource.getConnection(); QueryRunner qr = new QueryRunner(); int row = qr.execute(con, sql); System.out.println("update: "+ row); } catch (SQLException e) { e.printStackTrace(); } finally { DbUtils.closeQuietly(con); } } }
(3)CanalApplication 启动类
@SpringBootApplication public class CanalApplication implements CommandLineRunner { @Resource private CanalClient canalClient; public static void main(String[] args) { SpringApplication.run(CanalApplication.class, args); } //只要程序在执行状态,该方法就一直在执行 @Override public void run(String... strings) throws Exception { //项目启动,执行canal客户端监听 canalClient.run(); } }
(4)application.properties
# 服务端口 server.port=10000 # 服务名 spring.application.name=canal-client # 环境设置:dev、test、prod spring.profiles.active=dev # mysql数据库连接 spring.datasource.driver-class-name=com.mysql.cj.jdbc.Driver spring.datasource.url=jdbc:mysql://localhost:3306/guli?serverTimezone=GMT%2B8 spring.datasource.username=root spring.datasource.password=Tph123456
注意有个坑:如果是基于阿里云服务器安装的Canal,记得开放11111端口(Canal的默认端口号)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)