Apache DolphinScheduler 毕业的消息被北美科技媒体 TheNewStack 关注并邀请Apache DolphinScheduler PMC chair 代立冬 进行相关采访。节选内容:Like many IT projects, a new Apache Software Foundation top-level project, DolphinSchedu
原创 2022-01-05 14:30:33
130阅读
一. DolphinScheduler部署说明1.1 软硬件环境要求1.1.1 操作系统版本要求操作系统版本Red Hat Enterprise Linux7.0 及以上CentOS7.0 及以上Oracle Enterprise Linux7.0 及以上Ubuntu LTS16.04 及以上1.1.2 服务器硬件要求CPU内存网络4核+8 GB+千兆网卡1.2 部署模式DolphinSchedu
转载 2023-11-13 09:37:31
130阅读
# Apache DolphinScheduler 任务类型 没有java Apache DolphinScheduler是一个分布式调度系统,用于处理数据处理和流程的调度。在DolphinScheduler中,有多种任务类型可以选择,例如Shell任务、Python任务、Spark任务等。然而,在某些情况下,我们可能需要执行一个没有java代码的任务。本文将介绍如何在DolphinSchedu
原创 2024-04-06 06:52:36
64阅读
## 使用 DolphinScheduler 调度 Spark 程序的指南 DolphinScheduler 是一个功能强大的分布式调度系统,而 Apache Spark 是一个流行的大数据处理框架。在本文中,我将向你介绍如何使用 DolphinScheduler 调度 Spark 程序。我们将分步骤进行,并提供每一步所需的代码示例。 ### 流程概述 以下是使用 DolphinSchedu
原创 9月前
74阅读
# 实现 DolphinScheduler Hadoop 版本的步骤指南 DolphinScheduler 是一个分布式的工作流调度系统,支持 Hadoop 环境。对于刚入行的小白来说,了解如何实现 DolphinScheduler 的 Hadoop 版本是一个重要的学习过程。本文将为你提供一个详细的流程,以及每个步骤所需的代码和说明。 ## 实施流程 以下是实现 DolphinSchedu
原创 9月前
72阅读
DolphinScheduler是一款分布式的、易于使用的开源调度系统,它可以帮助用户管理和调度大规模的数据处理任务。DolphinScheduler支持多种任务类型,包括Hadoop、Spark、Flink、Hive、Python、Shell等,同时还提供了丰富的调度策略和监控功能,可以满足各种复杂的调度需求。DolphinScheduler的主要特点包括:分布式架构:DolphinSchedu
转载 2023-10-13 13:21:15
208阅读
1组件介绍Apache Dolphin Scheduler是一个分布式易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。官网​​https://dolphinscheduler.apache.org/en-us/​​github​​https://github.com/apache/incubator-dolphinschedu
原创 2022-09-08 13:23:29
1088阅读
官方文档地址:https://dolphinscheduler.apache.org/zh-cn/docs/3.1.9 DolphinScheduler简介 摘自官网:Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。 Apache DolphinSchedu
原创 2024-06-27 16:26:31
264阅读
# DolphinScheduler YARN调度器的科普 在大数据和分布式计算快速发展的今天,许多企业和组织都在寻找高效的数据处理和调度工具。**Apache DolphinScheduler** 是一种强大的分布式调度系统,专为处理大规模工作流而设计。DolphinScheduler 提供了多种调度器,其中 **YARN 调度器** 是最常用的一种。本文将深入探讨 DolphinSchedu
# DolpinScheduler Hive报错解决方案 最近在使用DolphinScheduler时,遇到了Hive报错的问题。Hive是一个数据仓库工具,用于处理大规模数据集的查询和分析。而DolphinScheduler是一个分布式工作流任务调度系统。当两者结合使用时,有可能会出现一些问题。下面我们来看看如何解决这个Hive报错的问题。 ## 问题描述 在使用DolphinSchedu
原创 2024-06-10 03:37:06
136阅读
如何使用海豚定时调度我们的Spark任务 在现代大数据应用中,能够有效地定时调度Spark任务显得尤为重要。尤其是在数据更新频繁、处理任务繁重的场景下,动态调度的能力可以显著提升系统的响应速度与处理效率。随着业务需求的不断变化,增强定时调度功能也成为多家企业的共同目标。 ### 问题背景 在我们的应用场景中,定时调度Spark任务的必要性突显出来。我们希望通过海豚(DolphinSchedu
原创 6月前
235阅读