本次活动邀请DolphinScheduler社区活跃贡献者,开源积极分子,现就职于政采云大数据部门,从事大数据平台架构工作的李进勇同学给大家分享相关内容。        同时也特别感谢示说网对本次直播活动的大力支持。PS:本章内容篇幅较长,请大家耐心阅读。为什么拆解json  &nb
//Curator是zk的一个客户端框架,其中分装了分布式公平可重入互斥锁,最为常见是InterProcessMutex先简单总结下MasterServier服务的启动流程:初始化netty服务器,并启动通过zookeeper客户端Curator创建一个znode临时节点 /dolphinscheduler/nodes/master/<ip>:<port>通过zookeep
转载 3月前
303阅读
Fork/Join是什么?Fork/Join框架是Java7提供的并行执行任务框架,思想是将大任务分解成小任务,然后小任务又可以继续分解,然后每个小任务分别计算出结果再合并起来,最后将汇总的结果作为大任务结果。其思想和MapReduce的思想非常类似。对于任务的分割,要求各个子任务之间相互独立,能够并行独立地执行任务,互相之间不影响。Fork/Join的运行流程图如下:
# Apache DolphinScheduler 任务类型 没有java Apache DolphinScheduler是一个分布式调度系统,用于处理数据处理和流程的调度。在DolphinScheduler中,有多种任务类型可以选择,例如Shell任务、Python任务、Spark任务等。然而,在某些情况下,我们可能需要执行一个没有java代码的任务。本文将介绍如何在DolphinSchedu
原创 4月前
36阅读
StreamGraph 构建和提交源码解析StreamGraph:根据用户通过 Stream API 编写的代码生成的最初的图。Flink 把每一个算子 transform 成一个对流的转换(比如 SingleOutputStreamOperator, 它就是一个 DataStream 的子类),并且 注册到执行环境中,用于生成 StreamGraph 它包含的主要抽象概念有 1、StreamNo
转载 9天前
28阅读
当前版本基于1.2.0实现,DS其他版本也可以使用相同思路完成概述DS安装过程中,需要的DS配置非常多,总结归类一共有六大部分。第一部分是零散的配置部分,包括DS安装路径、zk地址、部署用户等信息;第二部分主要是数据源参数配置;第三部分主要是邮件参数配置;第四部分是文件系统和yarn配置;第五部分是DS服务期部署机器配置;第六部分是DS服务环境变量配置。由于DS每个配置部分又有很多,对于部署人员来
转载 9月前
297阅读
  Java版工程项目管理系统 Spring Cloud+Spring Boot+Mybatis+Vue+ElementUI+前后端分离 功能清单如下: 首页 工作台:待办工作、消息通知、预警信息,点击可进入相应的列表项目进度图表:选择(总体或单个)项目显示1、项目进度图表  2、项目信息施工地图:1、展示当前角色权限下能看到的施工地图(地图坐标)。2、点击坐标点出现项目基本信
2020年2月24日发布了新版本1.2.1,从版本号就可以看出,这是一个小版本。主要涉及BUG修复、功能增强、新特性三个方面,我们会根据其发布内容,做简要的源码分析。  由于涉及内容较多,前端功能不再分析。Worker Server日志脱敏  主要是对日志中的密码进行脱敏。我们知道worker的日志是通过logback打印的,官方也就是通过配置conversionRule来实现过滤的。实现逻辑比较
转载 2023-07-29 23:26:26
181阅读
2021SC@SDUSC 文章目录一、总体分析——提纲挈领1.从服务提供的服务看DolphinScheduler模块设计2.从官方架构图看DolphinScheduler服务流程二、实机演示——百闻一见 在这里我们将进行一次工作流及任务的创建演示 三、代码解读——由浅入深 P.S:  作为对文章内容的补充以及为读者理解整个DophinSchedule
https://github.com/apache/dolphinscheduler这是一系列关于 DolphinScheduler v2.0.1的源码分析文章,包括对 Master、Worker 基本原理、Master 提交执行、Worker 接受执行、 command 解耦、command 唯一消费实现原理、kill 执行分析等在内的深度解析与思考。1command唯一消费实现原理实
dolphinscheduler3.0.1功能梳理部署首页项目管理项目概览工作流工作流定义工作流实例资源中心数据质量数据源中心监控中心服务管理统计管理安全中心 工作中经历了1.2.1和2.0.5版本,最开始准备研究一下1.2.1源码,结果2.0面世了,那就研究2.0吧,结果3.0面世了。其实不管研究哪个版本都能学到不少东西。现在确定了,开始学习3.0版本。 后续会对每个功能点进行介绍,以及涉及到
# 实现 Dolphinscheduler 执行 Java 任务 ## 1. 流程概述 在实现 Dolphinscheduler 执行 Java 任务的过程中,需要经历以下几个步骤: 1. 创建一个 Java 任务 2. 配置任务的参数和依赖关系 3. 编写 Java 代码 4. 将代码打包成可执行的 jar 文件 5. 将 jar 文件上传到 Dolphinscheduler 的资源管理器
原创 11月前
1951阅读
# 如何配置DolphinScheduler的Hive CLI任务节点 作为一名经验丰富的开发者,我将教会你如何配置DolphinScheduler的Hive CLI任务节点。在开始之前,我们先来了解一下整个流程。 ## 配置Hive CLI任务节点的流程 下面是配置Hive CLI任务节点的流程表格: | 步骤 | 动作 | | ---- | ---- | | 1 | 创建Hive CL
原创 7月前
142阅读
一、Reader插件和Writer插件“reader”: { “name”: “mysqlreader”, #从mysql数据库获取数据(也支持sqlserverreader,oraclereader) “name”: “txtfilereader”, #从本地获取数据 “name”: “hdfsreader”, #从hdfs文件、hive表获取数据 “name”: “streamread
转载 1月前
37阅读
# 如何实现Apache DolphinScheduler Java任务 ## 简介 作为一名经验丰富的开发者,我将教会你如何实现Apache DolphinScheduler中的Java任务。Apache DolphinScheduler是一个分布式的任务调度系统,它支持多种任务类型,其中包括Java任务。 ## 整体流程 下面是实现Apache DolphinScheduler Java
原创 7月前
235阅读
# Java 提交 DolphinScheduler 任务 ## 介绍 [DolphinScheduler]( 是一个分布式的大数据工作流调度系统,它可以帮助用户方便地进行任务调度和任务管理。同时,DolphinScheduler 还支持 Java 提交任务,使得开发者可以通过 Java 代码来提交任务并获取任务执行结果。 本文将介绍如何使用 Java 提交 DolphinScheduler
原创 7月前
93阅读
# 使用Java提交DolphinScheduler任务 DolphinScheduler是一款开源的分布式调度系统,用于定时和周期性任务的管理,广泛应用于数据处理和工作流自动化等场景。本文将介绍如何使用Java语言通过DolphinScheduler API提交任务,并提供相关的代码示例与说明。 ## DolphinScheduler的基本概念 在使用DolphinScheduler之前,
原创 23天前
44阅读
# Java调用DolphinScheduler任务 ## 步骤 以下是Java调用DolphinScheduler任务的整体流程: | 步骤 | 描述 | | --- | --- | | 1 | 创建DolphinScheduler任务 | | 2 | 设置任务参数 | | 3 | 调用DolphinScheduler API 执行任务 | | 4 | 监控任务状态 | | 5 | 获取任
原创 4月前
149阅读
?DolphinScheduler实例表备份、清理?一、前言  DolphinScheduler至今已经在项目中使用了将近一年,工作流实例和任务流实例都积累了百万级的数据量。在查看工作流实例和任务实例的时候,都要等待后台去查询数据库,感觉在使用上不太方便。所以想着以某一日期为界限,备份后再清除这部分数据。?二、查看实例表?♀2.1 工作流实例表结构CREATE TABLE `t_ds_proces
今天继续分析海豚调度的源码上回分析的是dolphinscheduler-service模块zookeeper相关的代码这回分析是dolphinscheduler-server模块zookeeper相关的代码ZkMasterClient master服务zk客户端类类继承的关系如下: 这个类的方法如下: 方法介绍:start()  根据路径dolphins
  • 1
  • 2
  • 3
  • 4
  • 5