kettle sql server驱动程序下载 kettle服务

转载

小蝌蚪 2023-08-07 13:29:07

文章标签 etl 数据 Server 图形化 文章分类 SQL Server 数据库

kettle介绍及组成

一、kettle 是什么

kettle 是一个ETL工具，ETL（Extract-Transform-Load，数据抽取、转换、装载）；
kettle 是java编写，绿色无需安装，抽取高效稳定；
kettle 主要用来对不同数据库的数据，不同来源的数据进场处理；
kettle 提供图形化的用户界面，用来使用户使用时描述想做什么，而不是想要怎么做；
kettle 有两种脚本文件 transformation和 job；transformation 是转换，job 是对多个转换构建的整个工作流的抽象和控制；

kettle 的概念模型

kettle sql server驱动程序下载 kettle服务_数据

执行分为两个层析：job和transformation

二、kettle 的组成

kettle 的结构由两部分组成：Spoon 和 Data Integration Server

Spoon：

是构建ETL Jobs和Transformations的工具。
是以拖拽图形化进行设计转换和作业。
可以通过Spoon调用数据集成引擎或者集群；

Data Integration Server：

是专用的ETL Server
执行：执行ETL的作业和转换
安全性：管理用户、角色、集成的安全性
内容管理：提供一个集中的资源库。管理ETL的转换和作业。资源库包含所有内容和特质的历史版本
时序安排：向spoon 提供管理Data Integration Server 上活动的时序和监控的服务

kettle 的核心组件

spoon：通过图形接口，编辑作业和转换的桌面应用
pan：一个独立的命令行程序，用于执行由spoon编写完成的转换和作业
kitchen：一个独立的命令行程序，用于执行由spoon编辑的作业
carte：轻量级的web容器，用于建立专用、远程的ETL Server

三、kettle 的核心概念

转换：转换是 kettle 中最基础的，主要的部分；进行抽取数据、转换数据、加载数据、输出数据等等操作；
作业：由一个或者多个转换或者作业组成，作业运行时，按照自定义的顺序执行。
跳：是步骤之间的链接，定义了步骤之间的数据通路。
步骤：组成转换的基本部分，由一个或者多个步骤组成转换，步骤之间都是独立的线程，可以并发执行；

补充：