携程数据分析师面试携程大数据开发面经

关注 mob64ca14068b0b

文章目录

携程面试
一面（20220513）：
二面（20220517）

携程数据分析师面试携程大数据开发面经

转载

mob64ca14068b0b 2023-09-01 19:40:41

文章标签 携程数据分析师面试面试分块 mysql hadoop 文章分类 数据分析人工智能

携程面试

一面（20220513）：

自我介绍
项目介绍
项目遇到的困难
yarn机制

三个主要的组件：

ResourceManager:整个系统只有一个，用于负责资源的调度

包含两个主要组件：

定时调用器（Scheduler）：给任务分配资源
应用管理器（ApplicationManager）：监控、跟踪程序状态

ApplicationMaster
NodeManager：负责容器的资源管理

用户提交资源申请（YARN程序）--->资源管理器找到一个节点管理器，启动容器，运行application master进程--->资源管理器分配资源（如果能在本地完成任务，则直接完成然后返回；如果不能完成，则需要向资源管理器请求更多的节点管理器然后运行容器执行任务）--->申请到新的节点管理器，启动容器运行应用程序
任务调度器问题：

FIFO：没啥说的，先进先出，先来的执行完了后面才能执行
容量调度器（大小任务分开）：

分配多个队列，每个队列固定容量（需要配置），内部使用FIFO调度，队列执行并行执行

公平调度器（可抢占资源——需要设置条件，比如何时能抢占，或者抢占等待时间）：

分配多个队列，每个队列可以指定资源大小，不指定则均匀分配，队列内则是均匀分配资源（共享内存）
可以配置队列运行程序数量，（超出数量的则会等待前面任务完成再申请资源）

项目数据库设计
关于评论数据库优化的问题
mysql递归问题

mysql8有一个with recursive语法可以实现递归
mysql8以下可以使用子查询或者创建函数

k8s
设计模式

二面（20220517）

自我介绍（自己提到的在看mapreduce的论文）
hadoop底层原理

答的最底层是hdfs，然后上面有yarn管理资源分配调度在上面是mapreduce和hbase之类的应用层

mapreduce流程

照着论文的流程答了一遍

先是数据分块
然后分配master结点
将分块传送给map函数，map函数进行处理

这里打断提了个问题，问hadoop默认分块大小，我答的64MB，因该是128MB，64是GFS的分块大小（论文里），hadoop系统上显示的块大小为128MB
然后接着这个问题问了一个分块大小和什么有关，答的和节点数有关，map任务数量应该远大于所有工作结点数量，这样才能保证效率

map函数全部处理完会写入本地文件，然后给master发信号，master接到信号后给reduce发信号通知reduce来读取数据进行第二步reduce操作
reduce将map结果文件全部读取到本地，在本地进行排序，然后输送给reduce函数
reduce处理完毕之后追加结果到结果文件
reduce结束，给master发信号，等所有任务结束，master返回用户代码

问爬虫项目细节

问用没用框架，如何实现的
大致说了一下流程，特别问了一下验证码如何处理的（答的手动处理，因为没有时间，没有使用人工智能算法）

是否还知道其他大数据生态

说了离线相关的，实时的只知道名字，不知道细节
问了下hive的原理和作用，以及什么时候使用

未来规划
学习方式
是否懂spark flink

等结果出来在更新
这段时间要去补个项目了，不然没相关项目只知道基础面试官都没啥问的

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：java防止sql注入的字符串处理函数防止sql语句注入

下一篇：hue是用什么方式连接hive cdh连接hive

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册