flink 开启ckeckpoint flinkcheckpoint存储在哪

转载

编程梦想编织者 2024-03-17 23:06:19

文章标签 flink 开启ckeckpoint c++上传oss中文路径报错 flink hadoop jar 文章分类 架构后端开发

导读：Flink 提供了Savepoint保存点，我们可以使用 Savepoint 进行 Flink 作业的停止与重启恢复等。而保存点存储位置是由flink-conf.yaml配置文件中的state.savepoints.dir属性进行指定的。常见如存储在本地 file:///flink/savepoints或 HDFS hdfs:///flink/savepoints，Flink同时也支持了其他的Flie System，本章主要讨论的是如何将savepoint存于阿里云OSS上。

基础概念

Flink Savepoint，是依据 Flink checkpointing 机制所创建的流作业执行状态的一致镜像。可以使用 Savepoint 进行 Flink 作业的停止与重启、fork 或者更新。
OSS，是阿里云提供的海量、安全、低成本、高可靠的云存储服务，提供99.9999999999%的数据可靠性。使用RESTful API 可以在互联网任何位置存储和访问，容量和处理能力弹性扩展，多种存储类型供选择全面优化存储成本。

flink 开启ckeckpoint flinkcheckpoint存储在哪_jar

配置

注：本例Flink采用Standalone Cluster形式部署，版本 1.10

1、为了使Flink支持OSS，需要将 /flink/opt 目录中将 flink-oss-fs-hadoop-1.10.0.jar 复制到 /flink/lib 目录下。其作用是为oss:// scheme的 URLs 注册默认的FileSystem包装器。

flink 开启ckeckpoint flinkcheckpoint存储在哪_c++上传oss中文路径报错_02

2、修改/flink/conf/flink-conf.yaml 文件中state.savepoints.dir属性，缺省Savepoint目标目录

state.savepoints.dir: oss:///

flink 开启ckeckpoint flinkcheckpoint存储在哪_c++上传oss中文路径报错_03

3、设置OSS FileSystem包装器后还需要添加确保允许Flink可以访问OSS的一些配置

flink 开启ckeckpoint flinkcheckpoint存储在哪_jar_04

#必须配置的参数fs.oss.endpoint、fs.oss.accessKeyId、fs.oss.accessKeySecret#其他配置可参考http://hadoop.apache.org/docs/current/hadoop-aliyun/tools/hadoop-aliyun/index.html

4、启动集群

#启动集群/flink/bin/start-cluster.sh

flink 开启ckeckpoint flinkcheckpoint存储在哪_flink 开启ckeckpoint_05

测试

1、通过Apache Flink Dashboard 提交一个Flink Job

flink 开启ckeckpoint flinkcheckpoint存储在哪_flink_06

2、使用REST API 接口停止 Job

Flink 官方提供了一套REST API，可用于查询正在运行的作业以及最近完成的作业的状态和统计信息等。https://ci.apache.org/projects/flink/flink-docs-stable/monitoring/rest_api.html

这里我们调用 /jobs/:jobid/stop 停止Job，这里有两个参数：

targetDirectory：指定savePoint的保存地址(根据官方文档说明，在这里指定目标目录会覆盖缺省值。而如果既未配置缺省值也未指定自定义目标目录，则触发 Savepoint 将失败)
drain：(可选)设置为true可以在获取保存点之前刷新MAX_WATERMARK，以清除等待计时器启动的任何状态

flink 开启ckeckpoint flinkcheckpoint存储在哪_jar_07