mapreduce技术架构 mapreduce计算架构和计算过程

转载

mob6454cc73e9a6 2023-07-15 15:12:12

文章标签 mapreduce技术架构并行计算 Hadoop 资源分配 文章分类 架构后端开发

MapReduce是Hadoop的一个并行计算框架,将一个计算任务拆分成为两个阶段分别是Map阶段和Reduce阶段.Map Reduce计算框架充分利用了存储节点(datanode)所在的物理主机的计算资源(内存/CPU/网络/少许磁盘)进行并行计算.MapReduce框架会在所有的存储节点上分别启动一个Node Manager进程实现对存储节点的计算资源的管理和使用.默认情况下Node Manager会将本进程运行的物理主机的计算资源抽象成8个计算单元,每个单元称为一个Container,所有Node Manager都必须听从Resource Manager调度.Resource Manager负责计算资源的统筹分配.

ResourceManager：统筹计算资源，管理所有的NodeManager，进行资源分配

NodeManager：管理主机上计算资源Container负责向MR汇报自身的状态信息

MRAppMaster：计算任务的Master，负责申请计算资源，协调计算任务

YarnChild：负责做实际计算的任务/进程(MapTask/ReduceTask)

Container：是计算资源的抽象代表着一组内存/cpu/网络的占用，无论是MRAppMaster还是YranChild运势是都需要消耗一个Container逻辑

mapreduce技术架构 mapreduce计算架构和计算过程_并行计算