增量数据订阅和消费,用户对数据库 *** 作,比如DML, DCL, DDL等,这些 *** 作会产生增量数据,下层应用可以通过监测这些增量数据进行相应的处理。典型代表Canal,根据MySQL的binlog实现。也有针对Oracle(redolog)的增量数据订阅与消费的中间件。(Canal, Erosa)
数据库同步中间件涉及数据库之间的同步 *** 作,可以实现跨(同)机房同步以及异地容灾备份、分流等功能。可以涉及多种数据库,处理之后的数据也可以以多种形式存储。(Otter, JingoBus, DRC)
数据库与数据库之间会有数据迁移(同步)的动作,同款数据同步原理比较简单,比如MySQL主备同步,只要在数据库层进行相应的配置既可,但是跨数据库同步就比较复杂了,比如Oracle->MySQL. 数据迁移一般包括三个步骤:全量复制,将原数据库的数据全量迁移到新数据库,在这迁移的过程中也会有新的数据产生;增量同步,对新产生的数据进行同步,并持续一段时间以保证数据同步;原库停写,切换新库。将“跨数据库”这个含义扩大一下——“跨数据源”,比如HDFS, HBase, FTP等都可以相互同步。(yugong, DataX)
阿里巴巴使用的不是一种数据库,而是一种云数据平台,叫Apsara,是阿里巴巴自己开发的。因为数据量、运算量等等的关系,普通的数据库架构不能满足阿里巴巴的数据处理需要,才开发了Apsara这种云架构可扩展的数据存储处理平台。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)