GBase 8a 与Hadoop(HDFS)数据交换方案

GBase 8a 与Hadoop(HDFS)数据交换方案,第1张

GBase 8a 与Hadoop(HDFS)数据交换方案

Gbase 8a 支持试用Load SQl的方式直接从Hadoop读取数据文件后,将数据加载到数据库中,主要说明如下:

1)       在Gbase 8a上,使用Load SQL语句方式,进行数据加载,语句举例:

LOAD DATA INFILE  'hdp://hadoop@172.16.4.55:50070/user/hdfs/export/t1.snappy' INTO TABLE test.t1 FIELDS terminated by '|';

2)       Gbase 8a 管理节点(gc)将通过Name Node 获取数据文件的具体存储信息,包括存储的文件大小,数据分布的DataNode信息等:

3)       管理节点将获取后的信息,加入到执行计划中,下发到Gbase 各个计算节点;

4)       计算节点根据执行计划,访问hadoop的Data node,读取数据加载入库;

5)       支持NameNode 高可用;

6)       每次加载任务,与NameNode进行一次交互,加载过程中不再与NameNode产生交互;

7)       Gbase 8a的加载会充分利用CPU、IO、网络等资源,因此加载任务的并发不需要太多,一般生产系统上加载任务的并发也不会超过10或20个,而加载任务过程中(每个任务会持续一段时间,视加载的文件大小而定),只是在最初访问一次Namenode,中间过程与Namenode不产生交互,因此对于Name Node 的影响几乎没有影响。

8)       Gbase支持hadoop协议包含webhdfs、hdfs3;支持的文件格式包含txt、csv、gzip、snappy、lzo、avro、json。

9)       支持Kerberos认证。

 

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5688738.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存