yarn和node的关系 yarn和mapreduce的关系

关注温柔一刀

yarn和node的关系 yarn和mapreduce的关系

转载

温柔一刀 2023-11-19 07:07:40

文章标签 yarn和node的关系 mapreduce value 排序键值对数据任务处理 文章分类 Yarn 大数据

yarn和node的关系 yarn和mapreduce的关系_任务处理

MapReduce 简介

MapReduce 是一种编程模型，是一种编程方法，是抽象的理论。

YARN 概念

YARN 是 Hadoop 2.0 版本以后的资源管理器，即 MapReduce 2.0，相比于 1.0 版本，架构中的各个模块分工明确，在性能和稳定性上都有所提升。YARN 负责整个集群资源的管理和调度，也就是说所有的 MapReduce 都需要通过它来进行调度，支持多种计算框架。

yarn和node的关系 yarn和mapreduce的关系_数据_02

YARN 架构图

YARN 的几个概念：

ResourceManager
ApplicationMaster
NodeManager

1、ResourceManager

负责接受客户端提交的 job，分配和调度资源
启动 ApplicationMaster，判断 job 所需资源
监控 ApplicationMaster，在其失败的时候进行重启
监控 NodeManager

2、ApplicationMaster

为 MapReduce 类型的程序申请资源，并分配任务
负责相关数据的切分
监控任务的执行及容错

3、NodeManager

管理单个节点的资源，向 ResourceManager 进行汇报
接收并处理来自 ResourceManager 的命令
接收并处理来自 ApplicationMaster 的命令

MapReduce 编程模型

场景：输入一个大型文件，通过 split 将其分成多个文件分片
Map：每个文件分片由单独的机器进行处理，这就是 Map 方法
Reduce：将各个机器的计算结果进行汇总，得到最终的结果，这就是 Reduce 方法

Map 任务处理

读取输入文件的内容，解析成键值对，把文件的每一行解析成键值对，每个键值对调用一次 map 函数；(Input)
写自定义的逻辑，对输入的键值对进行处理，转换成新的键值对输出；(Map)
对不同分区的数据，按照键（key）进行排序和分组，key 相同的值（value）放到一个集合中；(Sort -> Combine)
把输出的键值对（此时只是中间结果）按照 key 的范围进行分区处理；(Partition)
分组后的数据进行 reduce 处理。

Reduce 任务处理

对多个 map 任务的输出，按照不同分区，通过网络 copy 到不同的 reduce 节点；
对多个 map 任务的输出进行合并和排序，自定义 reduce 函数的逻辑，对输入的键（key）和值（value）进行处理，转换成新的键值对输出；(Reduce)
把 reduce 的输出保存到文件中。(Output)

MapReduce 的整个工作流程可以归结为：

Input -> Map -> Sort -> Combine -> Partition -> Reduce -> Output

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：android 之一模块化方法程序开发的插件化 android插件化开源

下一篇：android开发socket客户端通过地址解析dns获取到hostIp socket获取本地ip

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册