Kettle实战之(2)过滤记录

Kettle实战之(2)过滤记录,第1张

首先,弱弱的问一下 您的安装方式是采用什么方式? rpm包还是bin包,或者还是找到的源码包手动编译安装的?如果具体的情况不明确的话,也不好说,建议重新安装软件包。然后就是环境变量的问题了。当然了,路径中不要含中文,相信楼主也是明确的吧
然后,如果是前两者,建议去官网上下载最近的安装包,加入可执行权限后运行即可~ 建议是用管理员用户在宿主目录中运行,这样运行时可以避免其他参数的的设定问题
J2SE JDK RPM包下载URL -6u22-linux-i586-rpmbin
BIN包下载URL 2-linux-i586bin
如果有别的需求,下面提供官网下载地址
如果有安装问题,可以查看官网的帮助信息,,不过是jre的,中文的哦 URL:
java安装完成之后,导入环境变量。可以导入到文件(/etc/bashrc或者是宿主目录的bashrc 记住,那是个隐藏文件哦,如果没有这么文件的话试试看 bash_profile,在文件的末尾添加一下代码即可),也可以导入到临时变量
export NEO=/usr/java/jdk 这里是安装java的路径,需要精确到jdk的那个目录,代表版本号
export PATH=NEO/bin : $PATH 记住,这里的分隔符是 冒号 不是 分号~
export CLASSPATH=NEO/lib::$CLASSPATH 需要添加当前目录 所有有一个 同样需要:分隔
gcc的话,建议在安装光盘中查找,是用rpm命令即可安装,具体命令我就不用废话了吧
建议看看gcc的几个软件包的依赖关系,从而完整的安装,应该问题就不大了
祝好运
斑驳敬上
请参考

Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。
Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。
两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码。
易用性:
Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供。
Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
技术支持:
Talend:主要在美国
Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员。
部署:
Talend:创建 java 或perl 文件,并通过 *** 作系统调度工具来运行
Kettle:可以使用 job 作业方式或 *** 作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署。
速度:
Talend:需要手工调整,对特定数据源有优化知识。
Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计。
数据质量:
Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
监控:
Talend:有监控和日志工具
Kettle:有监控和日志工具
连接性:
Talend:各种常用数据库,文件,web service。
Kettle:非常广泛的数据库,文件,另外可以通过插件扩展


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13494295.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-18
下一篇 2023-08-18

发表评论

登录后才能评论

评论列表(0条)

保存