GBase 8a与Oracle的数据交换方案

GBase 8a与Oracle的数据交换方案,第1张

GBase 8a与Oracle的数据交换方案 Gbase与Oracle的数据交换

1.1 Oracle到Gbase

Oracle到Gbase的数据流转,一般使用南大通用自行研发的三款工具进行数据同步,分别为Orato8a、Rtsync、MTK,三款工具各有各的应用场景;除此外也可使用第三方ETL工具,如kettle、informatic等。

1.1.1 Orato8a导入导出

Orato8a是南大通用研发的一款专为Oracle到Gbase 8a的数据迁移工具,基本流程是先将Oracle中的数据导出成Gbase 8a能识别的落地数据文件,然后通过调取Gbase的load命令进行数据加载,完成数据的迁移。

一般使用场景为:

1)以脚本的形式,完成全量数据的迁移;命令如下:

./orato8a --user=’连着串’ --owner=’表的所有者’ --table_name="表名" --file=落地文件 --field="分割符" --format=3 

2)通过SQL以时间字段过滤的方式,迁移增量数据,实现T+1的增量同步方式;命令如下:

./orato8a --user=’连着串’ --query="select col from tbname1 where etl_date > ’2020-10-01’ " --file=落地文件 --field="分隔符" --format=3

1.1.2 RTSYNC增量

Rtsync是南大通用研发的一款增量数据同步工具,它本身也是集成了orato8a功能,所以它既支持Oracle到Gbase 8a的增量数据同步,也支持全量数据同步。增量同步主要流程为:Rtsync通过挖掘Oracle的日志信息,并将其转化为json或者PUREDATA格式发送给KAFKA消息队列,Gbase 8a以自身集成的consumer组件去消费kafka中的数据;具体流程图如下:

1.1.3 GoldenGate增量

    Gbase 8a 支持使用GoldenGate 将oracle的增量同步到Gbase 8a MPP Cluster,功能与Rtsync类似,GoldenGate将解析日志后的增量数据写入到Kafka,Gbase 8a 通过Kafka进行消费入库。

1.1.4 MTK全量

MTK(GbaseMigrationToolkit)是南大通用研发的一款迁移表结构及数据的工具。主要用于迁移表结构及维度表等小数据量表的数据迁移。源端支持Oracle、DB2、达梦、SQL SERVER、Gbase 8s、MySQL、teradata、postgre、ACCESS等主流数据库。

3.1.5 第三方ETL工具

异构数据库间的数据流转都是可以使用第三方ETL工具进行数据清洗和流转,如kettle、informatic等;这种方式一般都是基于JDBC和ODBC接口来对数据进行拉取,性能上远不及导入导出的速度。

1.2    Gbase到Oracle

Gbase到Oracle的数据流转,一般存在三种方式,具体如下:

l  导入导出

Gbase 8a到Oracle的数据流转,可以采用数据导入导出的方式实现。Gbase 8a端可以通过SQL的形式导出分析统计后的结果,落地成数据文件,然后Oracle通过数据泵的方式加载到表中。

l  Dblink

Gbase 8a可以通过dblink工具,使用insert..... select.....的方式将数据推向远端Oracle。

l  第三方ETL工具

可通过kettle、informatic等第三方ETL工具,实现数据的清洗与流转。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5688753.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存