基于hadoop架构图 hadoop基本架构图

关注编程小匠人

文章目录

1、Hadoop 是什么
2、Hadoop 组成结构
2.1、 HDFS 架构
2.2、 Yarn 架构
2.3、 MapReduce 概述

基于hadoop架构图 hadoop基本架构图

转载

编程小匠人 2023-07-31 17:17:30

文章标签 基于hadoop架构图 hadoop 大数据 Hadoop 数据 文章分类 Hadoop 大数据

1、Hadoop 是什么

Hadoop是现阶段数据开发的基础，Hadoop通常是指一个更广泛的概念----Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境)
是Apache公司使用Java语言编写的开源的，分布式系统的基础架构
分布式就是，当储存数据很多很大时，一台机器储存不了时，需要将数据切成块，使用多台计算机分布式储存这些数据。
由于专业的大数据的服务器比较昂贵，Hadoop解决了，在计算机级别服务器上的，大规模数据的存储和分析计算
Hadoop 官网

2、Hadoop 组成结构

HDFS ：分布式文件储存系统
Yarn ：资源管理和调度系统
MapReduce ：分布式运算系统
Hadoop 1.x 与 Hadoop 2.x 区别

基于hadoop架构图 hadoop基本架构图_Hadoop

2.1、 HDFS 架构

NameNode ：的主要工作就是和Client(客户端)打交道，接受Client的请求，以及管理元数据和集群(DataNode)等。
DateNode ：储存文件块，校验块信息。
Secondary NameNode ：是负责帮助NameNode分担任务量，持久化内存中的除文件块位置信息的所有元数据。
HDFS是主从结构，一个主节点，多个从节点，即一个NameNode，多个DateNode。

基于hadoop架构图 hadoop基本架构图_数据_02

2.2、 Yarn 架构

ResourceManager ：处理客户端请求、监控NodeManger、启动或监控ApplicationMaster、资源的分配与调度。
NodeManager ：管理单个节点上的资源、处理ResourcrManger和ApplicationMaster的命令。
ApplicationMaster ：负责数据切分、为应用程序申请资源并分配给内部的任务。
Container ：是Yarn中的资源抽象，它封装了某个节点上的多维度资源，例如CPU、内存、磁盘、网络等。

基于hadoop架构图 hadoop基本架构图_大数据_03

2.3、 MapReduce 概述

MapReduce 将计算分为两个阶段
Map阶段：并行处理输入数据
Reduce阶段：对Map结果进行汇总

基于hadoop架构图 hadoop基本架构图_Hadoop_04

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：java new对象内存优化 java对象内存分析

下一篇：C# 代码生成器下载 mysql c# il代码

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册