Sqoop02:Sqoop导出Hive数据到MySQL

Sqoop02:Sqoop导出Hive数据到MySQL,第1张

1.在Hive中建表:

2.插入数据:

insert into student(id,number,name,sex) values(1,'123456789','jack','man')

3.在MySQL建表:

4.编写导出命令

5.执行命令并查看MySQL表:

补充:如果出现了导入到MySQL的数据中文乱码

首先在mysql的指令界面输入以下命令:

show variables like 'character%'

出现以下界面,我的界面是这样的:

我按照搜到的答案用以下命令:

set character_set_database=utf8

set character_set_server=utf8

将我的界面改成了这样:

经过以上 *** 作问题成功解决

sqoop使用hsql来存储job信息,开启metastor service将job信息共享,所有node上的sqoop都可以运行同一个job

一、sqoop的配置文件在sqoop.site.xml中:

1、sqoop.metastore.server.location

本地存储路径,默认在tmp下,改为其他路径

2、sqoop.metastore.server.port

metastore service端口号

3、sqoop.metastore.client.autoconnect.url

sqoop自动连接的metastore地址,默认是本地的metastore地址

4、sqoop.metastore.client.enable.autoconnect

开启自动连接。sqoop默认连接本地metastore。注释这个配置会开启自动连接。

二、开启metastore service

sqoop下,nohup bin/sqoop metastore

三、创建job

sqoop支持两种增量导入模式,

一种是 append,即通过指定一个递增的列,比如:

--incremental append --check-column num_iid --last-value 0

varchar类型的check字段也可以通过这种方式增量导入(id为varchar类型的递增数字):

--incremental append --check-column id --last-value 8

另种是可以根据时间戳,比如:

--incremental lastmodified --check-column created --last-value '2012-02-01 11:0:00'

就是只导入created 比'2012-02-01 11:0:00'更大的数据。

bin/sqoop job --meta-connect jdbc:hsqldb:hsql://10.106.1.234:16000/sqoop --create job_zyztest13 -- import --connect jdbc:oracle:thin:@10.106.1.236:1521:orcl --username SQOOP --password sqoop --table LXC_TEST_HBASE_TO_ORACLE --columns NAME,SEX,age,CSRQ -m 1 --hbase-table SQOOP_IMPORT_TEST3 --column-family info --hbase-row-key NAME --split-by NAME --incremental lastmodified --check-column CSRQ --last-value '2012-02-01 11:0:00' --verbose

nohup /opt/hadoopcluster/sqoop-1.4.2.bin__hadoop-2.0.0-alpha/bin/sqoop job --exec job_zyztest13 >job_zyztest13.out 2>&1 &

此时,在10.106.1.234上创建了job_zyztest13这个job,通过bin/sqoop job --meta-connect jdbc:hsqldb:hsql://10.106.1.234:16000/sqoop --list可以查看所有job

四、定时执行

使用linux定时器:crontab -e

编辑定时器,添加*/4 * * * * /opt/hadoopcluster/sqoop-1.4.2.bin__hadoop-2.0.0-alpha/bin/sqoop job --meta-connect jdbc:hsqldb:hsql://10.106.1.234:16000/sqoop --exec job_zyztest13 >job_zyztest13.out 2>&1 &任务将会每四分钟执行一次


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/6156923.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-16
下一篇 2023-03-16

发表评论

登录后才能评论

评论列表(0条)

保存