Kettle是一个Java编写的ETL工具,主作者是Matt Casters,2003年就开始了这个项目,最新稳定版为9.4。2005年12月,Kettle从2.1版本开始进入了开源领域,一直到4.1版本遵守LGPL协议,从4.2版本开始遵守Apache Licence 2.0协议。Kettle在2006年初加入了开源的BI公司Pentaho, 正式命名为:Pentaho Data Integer
1.转换转换包括一个或多个步骤,步骤之间通过跳(hop)来连接。跳定义了一个单向通道,允许数据从一个步骤流向另一个步骤。在Kettle中,数据的单位是行,数据流就是数据行从一个步骤到另一个步骤的移动。 (1).打开 kettle,点击 文件->新建->转换(2).在左边 DB 连接处点击新建。(3).根据提示配置数据库,配置完成后可以点击测试进行验证,这边以 MySQL 为例。(4).
1.环境准备(1).在oracle上创建表及数据create table ORACLE_DATAX1( user_code VARCHAR2(20) not null, user_name VARCHAR2(50));insert into ORACLE_DATAX1 (user_code, user_name)values ('A001', '张三');insert into ORACLE_
DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。 Da
1.需求通过kettle工具,通过webservice获取天气信息,写成xml格式文件2.思路Kettle可通过两种选择获取webservice结果,一种是web服务查询(web service lookup),还一种是利用HTTP POST,本文介绍的是使用web服务查询的方式,数据来源为http://www.webxml.com.cn/WebServices/WeatherWebService
1.打开输入菜单栏,找到 表输入并拖入工作空间2.打开Output菜单栏,找到JSON Output并拖入工作空间3.打开Big Data菜单栏,找到MongoDB Output并拖入工作空间4.将以前3个控件拖入工作台后,然后后按住shift键,点击鼠标左键,吧各个步骤连接起来,完成后如下图5.进行相关的转换设置(1).双击表输入,进行编辑编辑数据库连接并选择需要输入的表(输入的数据库选择为sq
1.下载安装http://community.pentaho.com/projects/data-integration/2.环境准备jdk环境(kettle7.0必须依赖jdk1.7及以上版本)数据库环境(主要用于安装kettle的资源库,mysql oracle sqlserver 都可以,本例采用mysql)3.配置环境变量新建系统变量JAVA_HOME和CLASSPATH和 修改
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号