flink java调度 flink调度平台

转载

karen 2023-12-21 13:46:32

文章标签 flink java调度 flink 执行过程执行流 文章分类 Java 后端开发

flink作为一个分布式计算引擎，它可以在所有主流集群资源管理器中，如Hadoop YARN，Apache Mesos和Kubernetes，也可以运行在独立集群中。当然，它还提供了本地运行模式，可以供我们开发测试。

架构组成

flink集群中最重要的两个进程组件是：JobManager 和 TaskManager。
这是典型的主从架构：一个集群中只能有一个JobManager（HA部署的除外，它会有一个leader jobmager和一个standby jobmanager），但是可以有多个TaskManager。

JobManager

JobManager负责管理协调管理任务执行，主要功能如下：

调度任务执行
响应任务状态变化（任务完成，失败等）
协调checkpoints的生成（checkpoints的作用后续会讲）
失败恢复重启等等

JobManager中有三大组件：

ResourceManager
ResourceManager负责资源供给和分配，它管理着task slots(flink中任务的执行单元，可以类比线程进行理解)。
Dispatcher
Dispatcher提供了REST接口给客户端，用来提交任务至flink集群运行，同时也提供了webui方便用户查看job执行信息。
JobMaster
JobMaster负责管理JobGraph（job执行图）的执行。多个job可以同时运行在一个flink集群上，每个job拥有自己的JobMaster。