
2
出现欢迎界面后来到Repository Connection窗口,选择建立一个新的repository,随后出现“资源库信息”窗口:
在“资源库信息”窗口中选择新建一个数据库连接,d出“Database Connection”窗口:
在其中输入Connection Name, Host Name, Database Name, Port Number, User Name,Password信息即可建立连接,完成之后在Repository Connection窗口以admin用户名登陆。
新建一个名为cscgTransTest的Transformation,从“核心对象”中将两个“表输入”和一个“插入/更新”拖入到cscgTransTest中,并建立它们之间的连接,如下图所示:
在cscgTransTest中建立一个新的数据库连接ttt,通过表输入“max_createtime”从目标数据库ttt中获取某个表中最新数据的建立时间:
SELECT max(trunc(createtime)) FROMumdata.toeventmedia
在cscgTransTest中建立一个新的数据库连接testdb,以表输入“max_createtime”的查询结果替代表输入“umdata.toeventmedia”中的变量,执行SQL语句从数据库testdb中获取需要插入或者更新到ttt数据库的数据
SELECT * FROMumdata.toeventmedia where trunc(createtime) >= trunc(?)
在“插入/更新”中选择“数据库连接”、“目标模式”、“目标表”等信息,“用来查询的关键字”中的字段用来查询某条记录是否在目标表中存在,不存在则插入记录;如果存在,则继续比较其他字段是否与流里的字段值相同,如果相同则不执行任何 *** 作,如果不同则更新“更新字段”中所列字段。
“用来查询的关键字”所列字段是该表的primarykey,从而可以唯一标识一条记录。
分别为每一个表建立一个如上模式的转换步骤。
新建一个名为“cscgJobTest”的Job,在核心对象中将“START”和“Transformation”拖入cscgJobTest中,并建立两者之间的连接。
选中START中的“重复执行”,类型为“不需要定时”;在Transformation中将转换名设置为之前建立的“cscgTransTest”.
点击“Run this Job”运行。Job和Transformation的执行结果如如下:
Kettle是一款开源的ETL工具,可以用于数据抽取、转换和加载。下面是连接Oracle数据库的步骤:
下载并安装Oracle JDBC驱动,可以从Oracle官网下载。
启动Spoon,新建一个Trans。
点击左侧的Database,选择Oracle。
在连接Oracle数据库的页面,填写以下信息:
Host name: Oracle数据库所在的主机名或IP地址。
Port number: Oracle数据库的监听端口号,默认为1521。
Database name: 要连接的Oracle数据库名称。
User name: 连接Oracle数据库的用户名。
Password: 连接Oracle数据库的密码。
点击Test按钮,测试连接是否成功。
连接成功后,就可以在Trans中使用Oracle数据库了。
注意事项:
需要将Oracle JDBC驱动的jar包复制到Kettle的lib目录下。
在连接Oracle数据库时,需要保证Oracle数据库已经启动,并且监听程序也已经启动。
建立文件资源库:点击工具->资源库->连接资源库菜单使用文件资源库不需要用户名和密码,如果没有资源库可以点击右上角的"+"新建资源库,如下图:
第一种方式为建立数据库的资源库,本例选择使用文件资源库,选择确定后会要求选择文件资源库的路径,并给文件资源库设置一个ID和名称
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)