1前言
卷友们,大家好 ~ 我是梦想家 Alex原创更新频率挺高,主要还是感谢群友们的积极投稿,让我能得到这么多珍贵的素材,才有机会展示给大家~
本文作者: louwin
Part12022携程提前批大数据一/二面经(oc)
开篇先说明:本次面试的岗位是大数据底层框架工程师,不是大数据分析,数据仓库,数据开发。
个人:双非本硕
2一面
时常
45分钟
问题
因为我有一段大厂实习,所以主要针对我实习问了很久,一切问题都结合实习进行提问,所以要是没接触过没关系,咱们实习的内容不一样。而且因为当时暑期实习也是这个面试官面试的,所以基础的问题也没有怎么问。
- 实习做了什么,有什么收获
- 对于presto的理解,和hive/spark有什么不同
- 对sparksql调优有没有遇到,实际情况是什么
- 对框架apache atlas的理解
然后大概就是我表示很有缘,为啥后面没去(二面,一面时间隔得太久了当时),聊一下他们组正在干的事情,让我回去有空可以了解一下spark3还有一些别的(这段时间大概20分钟,心里已经很稳了)
感受
很棒,没有迟到
3二面
时长
1h45min,是的,你没看错,就是这么久,哎。
问题
时间过去有些久了,要是遗忘了请见谅。问题顺序也是乱的,不要在意这些细节。
- 自己平时用哪些编程语言
- ArrayList和LinkedList什么时候该用哪个:自己稍微解释一下就行,有自己的理解就好,不需要背课文
- ArrayList有上限么,如果有,能给出解决方方案么:我给了分布式存储和spark中压缩存储的方法这两个策略
- jvm gc 常见的方法:那几个概念稍微说一下就行,面试官知道你实际中没用过
- 如何判断发生了数据倾斜,有哪些情况会引起倾斜
- 如何找出在哪个部分发生了数据倾斜
- 如何在map/reduce端发生倾斜后,快速定位到出问题的表或者文件
- spark3新特性有哪些
- spark3新特性在实际工作中有关注过么
- presto和hive/spark区别,并且实际编写中有遇到什么困难:再次问到
- apache atlas:我介绍了如何监控元数据并且传递变化信息
- 数据治理一些常见的框架的交流和分析:有一些框架知道你没看过,只是想问你觉得会如何设计,比如如果实现一个对sql单元测试的模块,怎么设计
- mr job 有没有写过,基本流程是什么
- 一道智力题:和位运算有关
感受
很棒,没有迟到。而且问的其实大部分都不是之后工作可能接触最多的内容,问的很多还是偏向我实习的这部分,更多的想了解你的潜力,而不是你和我的岗位是不是完全匹配,所以会发现问的问题包含很多数仓的(实习做的数仓),这是我心中面试官的样子,不是拿个套路问问问的类型,看中的是人,而不是人会的技能,技能可以学,人变不了。