架构调优架构调整任务怎么做

转载

mob6454cc7042a2 2023-08-15 22:23:16

文章标签 架构调优大数据 flink 并行度数据 文章分类 架构后端开发

flink架构体系

架构调优架构调整任务怎么做_架构调优

JobManager处理器

也称之为Master，用于协调分布式执行，它们用来调度task，协调检查点(CheckPoint)，协调失败时恢复等。
负责资源申请，任务分发，任务调度执行，checkpoint的协调执行；
Flink运行时至少存在一个master处理器，如果配置高可用模式则会存在多个master处理器，它们其中有一个是leader，而其他的都是standby。

TaskManager处理器

也称之为Worker，用于执行一个dataflow的task(或者特殊的subtask)、数据缓冲和data stream的交换，Flink运行时至少会存在一个worker处理器。
负责任务的执行，基于dataflow(spark中DAG)划分出的task;与jobmanager保持心跳，汇报任务状态。

flink运行架构

flink的程序结构

1）source读取数据
2）transformation用对数据流进行转换操作
3）sink将处理后的数据输出到下游

架构调优架构调整任务怎么做_flink_02

flink的并行数据流

Flink程序在执行的时候，会被映射成一个Streaming Dataflow，一个Streaming Dataflow是由一组Stream和Transformation Operator组成的。在启动时从一个或多个Source Operator开始，结束于一个或多个Sink Operator。

flink中stream dataflow是并行化的

在执行过程中，一个流包含一个或多个流分区；而每一个operator包含一个或多个operator子任务。
比如下图中一个Source Operator可以有两个并行度，这两个并行度在flink里面会有两个subtask来处理

operator子任务间彼此独立，在不同的线程中执行，甚至是在不同的机器或不同的容器上。

operator子任务的数量就是operator的并行度。相同程序中的不同operator有不同的并行度。

架构调优架构调整任务怎么做_并行度_03

一个Stream可以被分成多个Stream的分区，也就是Stream Partition。
一个Operator也可以被分为多个Operator Subtask。

如上图中，Source被分成Source1和Source2，它们分别为Source的Operator Subtask。
每一个Operator Subtask都是在不同的线程当中独立执行的。
一个Operator的并行度，就等于Operator Subtask的个数。上图Source的并行度为2。
一个Stream的并行度就等于它生成的Operator的并行度。

数据在两个operator之间传递的时候有两种模式：

One to One 模式

一对一模式，两个operator用此模式传递的时候，会保持上游每个stream partition中数据的分区和排序，传递给下游某个分区；没有类似shuffle的操作。
如上图中的Source1到Map1，它就保留的Source的分区特性，以及分区元素处理的有序性。

Redistributing （重新分配）模式

重新分区，类似shuffle操作，数据会在上下游算子不同的subtask中分散。
例如上图中的keyby操作，会从不同的subtask里来拉取数据

Task和Operator chain（操作链）

Flink的所有操作都称之为Operator，客户端在提交任务的时候会对Operator进行优化操作；
能进行合并的Operator（one to one模式的Operator）会被合并为一个Operator，合并后的Operator称为Operator chain，实际上就是一个执行链

例如下图中source和map操作会合并成一个task，如果这个时候是两个task，可能在不同的taskManager上，此时可能会有数据的分散，把他们合并之后，相当于在一个task上，数据就在一个线程上，这样就避免了数据的远程发送，提高了效率

每个执行链会在TaskManager上一个独立的线程中执行。

架构调优架构调整任务怎么做_并行度_04

flink任务调度流程

流程图如下

架构调优架构调整任务怎么做_架构调优_05

具体流程

1）当Flink执行executor会自动根据程序代码生成DAG数据流图
2）ActorSystem创建Actor将数据流图发送给JobManager中的Actor

flink中不同的角色之间都是通过Actor来通信，程序拿到Client之后会通过Akka客户端来通信

3）JobManager会不断接收TaskManager的心跳消息，从而可以获取到有效的TaskManager
3）JobManager接收到数据之后就会进行数据的并行化、合并成操作链等优化操作，最后将每个operator chain的subtask再分发给TaskManager
4）JobManager通过调度器在TaskManager中调度执行Task（在Flink中，最小的调度单元就是task，对应就是一个线程）