Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算。
原创 2021-07-29 16:03:50
114阅读
定义Apache Flink 是一个分布式流式计算引擎,用于在数据流上进行有状态的计算(Flink系列:无界和有界数据流定义与区别)。特性低延迟有状态的 Flink 程序针对本地状态访问进行了优化。任务的状态始终保留在内存中,如果状态大小超过可用内存,则会保存在能高效访问的磁盘数据结构中。任务通过访问本地(通常在内存中)状态来进行所有的计算,从而产生非常低的处理延迟。故障恢复定期异步地对本地状态进行持久化存储来保证故障场景下精确一次的状态一致性...
原创 2022-03-09 11:08:53
112阅读
定义Apache Flink 是一个分布式流式计算引擎,用于在数据流上进行有状态的计算(Flink系列:无界和有界数据流定义与区别)。特性低延迟有状态的 Flink 程序针对本地状态访问进行了优化。任务的状态始终保留在内存中,如果状态大小超过可用内存,则会保存在能高效访问的磁盘数据结构中。任务通过访问本地(通常在内存中)状态来进行所有的计算,从而产生非常低的处理延迟。故障恢复定期异步地对本地状态进行持久化存储来保证故障场景下精确一次的状态一致性...
原创 2021-09-12 10:15:39
500阅读
作者:高二蛋 :恒生LIGHT云社区 主要内容: Flink是什么 为什么用Flink? 流处理的发展和演变 Flink的主要特点 Flink VS Spark Streaming 1.Flink是什么 Flink是一个框架(可以处理流和批处...
原创 2022-03-03 15:00:02
440阅读
Flink系列之时间 浪尖 浪尖聊大数据 一,fink支持的时间Flink的流式应用支持不同的时间观。1,处理时间处理时间是指执行相应操作的机器的系统时间。当流程序采用处理时间运行时,所有基于时间的操作(如时间窗口)将使用运行各自运算符的机器的系统时钟。例如,每小时处理时间窗口将包括在系统时钟显示一个小时的时间之间到达特定操作之间的所有记录。处理时间是最简单的时间概念,不需要流和机器之间的协调。它
原创 2021-03-17 11:35:56
343阅读
流式处理所使用的时间:事件时间,注入时间,处理时间。
原创 2021-07-23 17:19:52
491阅读
目录修改xml配置conf启动HA修改xml配置conf启动HA
原创 2022-01-16 11:00:48
231阅读
Runtime整体架构设计
原创 2021-09-10 18:03:58
530阅读
Runtime整体架构设计
原创 2022-01-11 15:07:46
203阅读
阿里云讲Flink的,还是蛮不错 https://yq.aliyun.com/articles/666043?spm=a2c4e.11153940.blogcont679659.23.9fae56e7bCYRX4
转载 2018-12-27 19:14:00
148阅读
2评论
目录修改xml配置conf启动HA修改xml配置conf启动HA
原创 2021-09-10 18:04:32
421阅读
声明:本系列博客为原创,是根据SGG的视频整理而成,非常适合大家入门学习。《2021年最新版大数据面试题全面开启更新》1. 工程目录<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schema
原创 2021-06-10 20:04:51
217阅读
安装好 Flink 后,我们来看下安装路径下的配置文件。安装目录下主要有 flink-conf.yaml 配置、日志的配置文件、zk 配置、Flink SQL Client 配置。1.flink-conf.yaml:基础配置:# jobManager 的IP地址jobmanager.rpc.address: localhost# JobManager 的端口号jobm...
原创 2021-06-21 15:52:51
1609阅读
安装好 Flink 后,我们来看下安装路径下的配置文件。安装目录下主要有 flink-conf.yaml 配置、日志的配置文件、zk 配置、Flink SQL Client 配置。1.flink-conf.yaml:基础配置:# jobManager 的IP地址jobmanager.rpc.address: localhost# JobManager 的端口号jobm...
原创 2022-03-28 17:26:47
1621阅读
声明:本系列博客为原创,是根据SGG的视频整理而成,非常适合大家入门学习。《2021年最新版大数据面试题全面开启更新》1. 工程目录<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schema
原创 2021-06-10 20:04:52
163阅读
在window窗口时间范围内,每一条记录都会计算watermark,watermark会一直保存增长的趋势,不会变小。event time、watermark、window时间关系曲线图
原创 2021-09-10 18:03:59
202阅读
原创 2021-09-10 18:03:59
142阅读
DataStream API 主要分为 块: DataSource Transformation, SinkDataSource是程序的数据源输入,可以通过 StreamExecutionEnvironment. addSource( sourceFunction)为程序添加1个数据源 Transformation 是具体的操作,它对一个或多个输入数据源进行计算处理,比如 Map FlatMap Filter 等操作 Sink 是程序的输出,它可...
原创 2021-09-11 10:40:17
169阅读
目录任务类型任务与slot任务类型分为三种:source,transformation,sink一个 Flink 程序由多个Source +多个Transformation+多个Sink组成。其中多个Source中的任意一个Source,叫做任务 多个Transformation中的任意一个Transformation也叫做任务
原创 2022-01-29 10:45:49
118阅读
DataStream API 主要分为 块: DataSource Transformation, SinkDataSource是程序的数据源输入,可以通过 StreamExecutionEnvironment. addSource( sourceFunction)为程序添加1个数据源 Transformation 是具体的操作,它对一个或多个输入数据源进行计算处理,比如 Map FlatMap Filter 等操作 Sink 是程序的输出,它可...
原创 2022-03-09 10:50:37
97阅读
  • 1
  • 2
  • 3
  • 4
  • 5