追源索骥:透过源码看懂Flink核心框架的执行流程前言1.从 Hello,World WordCount开始1.1 flink执行环境1.2 算子(Operator)的注册(声明)1.3 程序的执行1.3.1 本地模式下的execute方法1.3.2 远程模式(RemoteEnvironment)的execute方法1.3.3 程序启动过程2.理解flink的图结构2.1 flink的三层图结构2
转载 2024-03-26 22:08:40
11阅读
Flink 本身提供了多层 API ,具体结构层次如下: 过程函数(ProcessFunction)是 Flink 的最底层 API,它不定义任何的操作算子,仅仅通过统一的 process 操作。在处理函数中,使用者直面数据流中最基本的元素:数据事件(event)、状态(state)以及时间(time)。 https://nightlies.apache.org/flink/flink-docs
转载 2024-03-19 13:04:38
117阅读
文章目录前言一、时间语义1.1、Flink 中的时间语义1.1.1、处理时间(Processing Time)1.1.2、事件时间(Event Time)1.2、哪种时间语义更重要1.2.1、从《星球大战》说起1.2.2、数据处理系统中的时间语义1.2.3、两种时间语义的对比 前言 在流数据处理应用中,一个很重要、也很常见的操作就是窗口计算。所谓的“窗口”,一般就是划定的一段时间范围,
Flink 1.11 引入了 Flink SQL CDC,CDC 能给我们数据和业务间能带来什么变化?本文由 Apache Flink PMC,阿里巴巴技术专家伍翀 (云邪)分享,内容将从传统的数据同步方案,基于 Flink CDC 同步的解决方案以及更多的应用场景和 CDC 未来开发规划等方面进行介绍和演示。传统数据同步方案基于 Flink SQL CDC 的数据同步方案(Demo)Flink
转载 2024-08-27 10:11:44
52阅读
前言如果你在使用FlinkSQL时出现如下的报错:Tableisnotanappend-onlytable.UsethetoRetractStream()inordertohandleaddandretractmessages.那么你就有必要了解一下Flink中的回退更新。简介通俗的讲"回退更新"就是传统数据里面的更新操作,也就是说Retract是流式计算场景下对数据更新的处理。使用flinkSQ
原创 2021-03-15 09:33:50
216阅读