需求:1.源数据库新增一条记录,目标库同时新增一条记录;2.源数据库修改一条记录,目标库同时修改该条记录;示例用到三个Kettle组件 下面详细说下每个组件的配置Source:本示例连接的是Mongodb数据库,四个字段,ID默认为主键,_id会系统自动生成暂时先不管。本节点的详细说明,可见官网:http://wiki.pentaho.com/display/EAI/MongoDB+In
转载 2023-06-14 23:22:37
224阅读
一直用SSIS做ETL,越来越感觉这玩意不是亲生的.因此萌生换ETL工具的想法,不过Kettle社区版没什么调度系统,貌似错误处理也不是很方便,且先了解吧. 本文简略的记录了整个软件的使用流程. 开始Kettle 的几个子程序的功能和启动方式Spoon.bat: 图形界面方式启动作业和转换设计器。 Pan.bat: 命令行方式执行转换。 Kitchen.bat: 命令行方式执行
在php7的mongodb扩展中,当要查询某个集合在某个条件下的数据个数时,可以使用下面的方式来获取。比原生的命令要复杂许多比旧版mongo扩展也复杂许多需要使用到MongoDB\Driver\Command 这个类//查询条件 $filter=[]; //当需要分页显示,排序,和忽略字段 $options = [ 'skip
转载 2023-05-25 09:07:12
102阅读
先新建数据连接,然后1、新建转换, 然后选择表输入(表输入中可以放入你的任何sql),2、表输出,选择你想要输入的表。表输入只能直接插入进去,可以选择更新/插入选项。可以根据某个字段做修改,如果字段数据不存在就插入。 3、表输入到表输出,需要有一根线连接,可以通过按住shirt ,然后鼠标从表输入指向表输出即可。 然后吧转换保存,保存之后,在kettle的bin目录下新建一个b
Kettle的使用——Excel输出组件介绍使用Excel输出Mircrosoft Excel输出你可能感兴趣的内容 组件介绍在Kettle中,excel输出有两种方式,一种叫做Excel输出,一种叫做Microsoft Excel输出。常用于导出文件的需求或者测试数据的输出情况。使用Excel输出文件名: 文件输出的路径(可通过【浏览】选择路径)创建父目录: 根据文件名创建相应的目录启动时不创
转载 9月前
28阅读
一、输入人民币大写 一句话概括:在中文拼音输入法下,先输入字母V,再输入数字。 二、输入与上一行相同内容 输入与上一行同样的内容:Ctrl+D 此方法的高效率,不用韩老师描述吧? 三、输入已有内容 按住组合键Alt+↓,单元格上方已经输入的内容会自动出现,再用上下箭头或鼠标选取要重复输入的内容。 此种方法,不仅提高输入效率,而且减少
前言: 昨天我们讲了数据库相关操作,流查询,通过流查询我们进行等值查询,从而实现类似数据库内连接的效果,今天我们来讲一个类似的组件,叫合并记录,合并记录顾名思义就是将数据进行合并,具体来讲就是将两个不同来源的数据合并,这两个来源的数据分别为旧数据和新数据,该步骤将旧数据和新数据按照指定的关键字匹配、比较、合并。 一、合并记录今天我们讲的连接是转换里面的第八个分类。连接是结果集通过关键字进
转载 8月前
66阅读
数据库中的数据在不同的数据库中转换来装换去,由于不同库可能使用了不同的字符集,所以可能导致结果数据乱码问题。此次是在一个作业中跑数据,跑完数据前台数据显示出现乱码,检查了作业中的多有中间过程表,包括表输入的预览,表中的数据都是正常的,可想而知,问题肯定是处在“表输入”到“表输出”这个中间的转换环节上,根据能想到的,应该是字符集问题,为了更有保障的“表输入”和“表输出”的字符集相同,所以在表输
1、在学习kettle连接mongo之前,先给大家简单科普下mongo,避免有的童鞋跟不上节奏,老鸟跳过即可。MongoDB(简称Mongo)是一种开源的文档数据库管理系统,它采用了非常灵活的文档模型,可以存储和处理各种类型和结构的数据。MongoDB是一个面向文档的数据库,意味着它的数据存储在称为文档的BSON(二进制JSON)格式中。适合非结构化或半结构化数据存储、实时分析、日志记录、内容管理
文章目录前言kettle - 清洗 mongodb 数据案例一、需求二、kettle开发1、新建mongodb数据查询2、配置kettleTest集合与清洗后kettleTestClear集合字段映射3、根据_id进行排序4、使用java脚本将日期格式化5、进行字段选择6、将delete字段进行值映射7、mongo输出8、最后加一个写日志组件方便记录三、测试到此案例演示结束!!! kettle
转载 2023-08-12 12:57:01
289阅读
最近由于项目的需要,初步涉及到了Kettle的使用,现在将这两周自己使用kettle开发JOB的心得整理一下,与大家一起分享。 一、kettle是什么Kettle是个ETL工具,主要用来管理不同数据来源的数据,按照一定的方式流出来,最常用的情况,不同系统之间数据的传递,可以使用kettle制作转换JOB来完成。目前由于是纯JAVA语言编写,所以与Java兼容性最好。Kettle主要包括四
# MongoDBKettle 的结合使用 在现代大数据环境中,MongoDBKettle (也称为 Pentaho Data Integration, PDI) 是两个备受欢迎的工具。MongoDB 是一个高性能、高可用性、易扩展的 NoSQL 数据库,而 Kettle 是一款强大的 ETL (提取转换加载) 工具,能够帮助用户轻松地在不同数据源之间进行转换和同步。 ## Mon
原创 1月前
13阅读
目录项目场景问题分析解决方案MongoDB Delete插件使用总结项目场景项目使用的ODS层数据库是MongoDB;在数据中心从DB层向ODS层同步数据过程中,发现有张ODS表在同步过程中,数据突然发生锐减,甚至于该ODS表数据清0。同步技术使用的是kettle,在该ODS表的同步转换中,只有两个控件用来处理MongDB数据:一个是kettle本身自带的MongoDB output,一个是使用的
基本配置Configure Connection Tab 数据库连接Connection timeout:尝试连接数据库所等待的最大时间(毫秒),空为无限,建议5000Socket timeout:sql在执行成功之前等待读写操作的时间(毫秒),空为无限,建议5000Output Options Tab 输入表与相关设置Truncate option:在数据传输前清空表Upda
转载 2023-06-13 18:27:48
642阅读
1点赞
1评论
    经过测试发现,如果 MongoDB 需要验证的话,kettle 的 “MongoDB input” 组件是无法连接 MongoDB 的。那么我们怎么用 kettle 读入 MongoDB 的数据呢,笔者是如下操作的。第一步:把 MongoDB 的数据导出成 JSON 文件第二步:把第一步的操作设置成定时任务第三步:读取 JSON 文件  经过测试发现,kettle 无法
原创 2016-08-05 17:38:00
304阅读
文章目录1. 初步体验:csv 转为excelKettle概念配置mysql链接mysql 一对多关联查询结果保存到mongodb中 1. 初步体验:csv 转为excelWindows环境下安装pdi-ce-8.0.0.0-28.zip ,解压后执行lib下的Spoon.bat 将csv输入拖入 双击拖进去的csv,浏览选择csv文件,其他配置默认 点击获取字段,然后再点击预览同理将excel
转载 2023-08-26 19:37:57
151阅读
1. 插入/更新按照官方资料说明,插入/更新实现的功能只有两个:依据查询关键字段,将未被发现的行记录插入到表中。如果行记录在表中被找到,则比较需更新的字段,若更新字段不一致,则进行更新操作。插入\更新操作并不要求数据流里的字段及字段名称与目标表中的字段及字段名称一致,只需要自定义好映射条件即可。在MySQL中构建两个表personal_a和personal_b,其创建语句及原始数据如下。creat
本文介绍常用的输入控件:目录1 CSV文件输入2 文本文件输入3 Excel输入4 多文件合并5 Get data from XML6 JSON input7 生成记录8 表输入1 CSV文件输入2 文本文件输入  3 Excel输入前言:微软的Excel目前有两种后缀名的文件分别为:xls和xlsx xls:2007年之前 xlsx:2007年之后对于Excel文件,需要先选
目录一、基本知识储备二、前期准备三、将数据导入MongoDB四、MongoDB数据迁移至Hbase一、基本知识储备1、MongoDBMongoDB基本概念:数据库(database)集合(collection)文档(document)MongoDB基本指令:连接MongoDB:mongo IP:27017显示所有数据库: show dbs/ show databases进入指定数据库名: use
kettle:mongdb与mysql互传数据
转载 2023-06-07 15:49:51
399阅读
  • 1
  • 2
  • 3
  • 4
  • 5