kettle怎么建立数据库连接_sql

下载pdi-ce-4.4.0-stable.zip，解压到文件夹，打开data-integration中的Spoon.bat

出现欢迎界面后来到Repository Connection窗口，选择建立一个新的repository，随后出现“资源库信息”窗口：

在“资源库信息”窗口中选择新建一个数据库连接，d出“Database Connection”窗口：

在其中输入Connection Name, Host Name, Database Name, Port Number, User Name,Password信息即可建立连接，完成之后在Repository Connection窗口以admin用户名登陆。

新建一个名为cscgTransTest的Transformation，从“核心对象”中将两个“表输入”和一个“插入/更新”拖入到cscgTransTest中，并建立它们之间的连接，如下图所示：

在cscgTransTest中建立一个新的数据库连接ttt，通过表输入“max_createtime”从目标数据库ttt中获取某个表中最新数据的建立时间：

SELECT max(trunc(createtime)) FROMumdata.toeventmedia

在cscgTransTest中建立一个新的数据库连接testdb，以表输入“max_createtime”的查询结果替代表输入“umdata.toeventmedia”中的变量，执行SQL语句从数据库testdb中获取需要插入或者更新到ttt数据库的数据

SELECT * FROMumdata.toeventmedia where trunc(createtime) >= trunc(?)

在“插入/更新”中选择“数据库连接”、“目标模式”、“目标表”等信息，“用来查询的关键字”中的字段用来查询某条记录是否在目标表中存在，不存在则插入记录；如果存在，则继续比较其他字段是否与流里的字段值相同，如果相同则不执行任何 *** 作，如果不同则更新“更新字段”中所列字段。

“用来查询的关键字”所列字段是该表的primarykey，从而可以唯一标识一条记录。

分别为每一个表建立一个如上模式的转换步骤。

新建一个名为“cscgJobTest”的Job，在核心对象中将“START”和“Transformation”拖入cscgJobTest中，并建立两者之间的连接。

选中START中的“重复执行”，类型为“不需要定时”；在Transformation中将转换名设置为之前建立的“cscgTransTest”.

点击“Run this Job”运行。Job和Transformation的执行结果如如下：

方法/步骤

安装包下载后解压，运行setup.bat批处理文件，d出黑框，自动加载安装程序。

出现安装页面，点击下一步。

选择我接受许可协议条款（A），下一步。

选择完全安装，下一步

自动检测依赖条件，如果提示有不通过，去网上下载相关运行包。然后重新从第一步开始安装。

选择授权路径，即license文件，详细信息自动匹配。

选择安装路径，下一步。

点击安装。

创建远程管理帐号，这里默认即可。不是数据库的账号密码哦。

安装完成。默认自动初始化数据库，也可以手动初始化数据库。初始化数据库时建立相应的实例和用户名密码。

选择数据库类型资源库Kettle database repository，点击“确定”

在“资源库信息”窗口中，点击“新建”按钮，新建一个数据库连接

在“Database Connection”窗口，选择数据库类型，并填写数据库连接的相关信息，本实例选用oracle数据库。

欢迎分享，转载请注明来源：内存溢出

kettle怎么建立数据库连接