版权声明:本文为博主原创文章,未经博主同意不得转载。
https://blog.csdn.net/wl101yjx/article/details/32921691
写在前面一:
数据仓库ETL工具有非常多,基于大数据环境下的分析。
Hive用的多些。
本文介绍国外的 一款开源ETL工具——Kettle。
写在前面二:
所用软件说明:
一、什么是Kettle
Kettle是一款国外开源的ETL工具。
纯java编写。
绿色无需安装,数据抽取高效稳定(数据迁移工具)。
Kettle中有两种脚本文件,transformation和job,transformation完毕针对数据的基础转换,job则完毕整个工作流的控制。
二、
2.1、安装jdk
2.2、下载Kettle
Kettle下载链接
2.3、解压缩
cd /home/yujianxin/kettle/
unzip pdi-ce-5.0.1-stable.zip
安装完毕后,能够看到生成一个新的文件夹data-integration,则/home/yujianxin/kettle/data-integration即是kettle的安装和运行文件夹
2.4、配置kettle环境变量
2.5、验证Kettle是否安装成功
cd $KETTLE_HOME
运行./kitchen.sh,出现例如以下提示,则说明kettle安装成功
三、使用
3.1、启动kettle
cd $KETTLE_HOME
运行 ./spoon.sh。
就可以d出kettle的 *** 作界面
3.2、使用Kettle
关于Kettle的使用,欢迎qq(1152596901)交流。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)