前言

         有没有去面试的时候被问到Flink的面试题你答不上来,为什么那?,菜吗? 不是。原因是你接触的面试题太少了,那我今天就根据不同的群体来给大家你分享。

flinkjava 面试 flink面试问题_大数据面试题

1 Flink基础(适合初入职场)

  1. 简单介绍一下 Flink
  2. Flink相比传统的Spark Streaming区别?
  3. Flink的组件栈有哪些?
  4. Flink 的运行必须依赖 Hadoop组件吗?
  5. 你们的Flink集群规模多大?
  6. Flink的基础编程模型了解吗?
  7. Flink集群有哪些角色?各自有什么作用?
  8. 说说 Flink 资源管理中 Task Slot 的概念
  9. 说说 Flink 的常用算子?
  10. 说说你知道的Flink分区策略?
  11. Flink的并行度了解吗?Flink的并行度设置是怎样的?
  12. Flink的Slot和parallelism有什么区别?
  13. Flink有没有重启策略?说说有哪几种?
  14. 用过Flink中的分布式缓存吗?如何使用?
  15. 说说Flink中的广播变量,使用时需要注意什么?
  16. 说说Flink中的窗口?
  17. 说说Flink中的状态存储?
  18. Flink中的时间有哪几类
  19. Flink 中水印是什么概念,起到什么作用?
  20. Flink Table & SQL 熟悉吗?TableEnvironment这个类有什么作用
  21. Flink SQL的实现原理是什么?是如何实现 SQL 解析的呢?

2 Flink中级 (适合1~2年开发经验的人)

  1. Flink是如何支持批流一体的?
  2. Flink是如何做到高效的数据交换的?
  3. Flink是如何做容错的?
  4. Flink 分布式快照的原理是什么?
  5. Flink是如何保证Exactly-once语义的?
  6. Flink 的 kafka 连接器有什么特别的地方?
  7. 说说 Flink的内存管理是如何做的?
  8. 说说 Flink的序列化如何做的?
  9. Flink中的Window出现了数据倾斜,你有什么解决办法?
  10. Flink中在使用聚合函数 GroupBy、Distinct、KeyBy 等函数时出现数据热点该如何解决?
  11. Flink任务延迟高,想解决这个问题,你会如何入手?
  12. Flink是如何处理反压的?
  13. Flink的反压和Strom有哪些不同?
  14. Operator Chains(算子链)这个概念你了解吗?
  15. Flink什么情况下才会把Operator chain在一起形成算子链?
  16. 说说Flink1.9的新特性?
  17. 消费kafka数据的时候,如何处理脏数据?

3 Flink高级 (适合3年以上)

  1. Flink Job的提交流程
  2. Flink所谓"三层图"结构是哪几个"图"?
  3. JobManger在集群中扮演了什么角色?
  4. JobManger在集群启动过程中起到什么作用?
  5. TaskManager在集群中扮演了什么角色?
  6. TaskManager在集群启动过程中起到什么作用?
  7. Flink 计算资源的调度是如何实现的?
  8. 简述Flink的数据抽象及数据交换过程?
  9. Flink 中的分布式快照机制是如何实现的?
  10. 简单说说FlinkSQL的是如何实现的?

4 企业面试题(重点)

  1. 应用架构
  2. 压测和监控
  3. 有了Spark还为什么用 Flink
  4. checkpoint 的存储
  5. exactly-once 的保证
  6. 状态机制
  7. 海量 key 去重
  8. checkpoint 与 spark 比较
  9. watermark 机制
  10. exactly-once 如何实现
  11. CEP
  12. 三种时间语义
  13. 数据高峰的处理

小结

         好今天的Flink的题目就分享到这里,背过上面的那些题目害怕面试官提问?信自己,努力和汗水总会能得到回报的。我是大数据老哥,我们下期见~~~