Hadoop 是什么:
一句话就是 Hadoop 是个用来完成 MapReduce 模型的框架。我相信大家已经明白了。
Hadoop架构:
Hadoop 由两个主要的部件构成 HDFS (Hadoop Distriuted File System, hadoop 分布式文件系统) 和 YARN (Cluster resouces manager,集群资源管理器)。

集群:
一系列跑HDFS和YARN的计算机称之为集群, 而单个计算机称为节点。一个集群可以只有一个节点。
YARN 和 HDFS 由数个守护进程运行。Hadoop 是个服务。每个这种服务在各自的Java Virtual Machine(JVM)里面运行。
每个节点通过运行过程类型分为:主节点和工作节点。主节点为工作节点运行协调服务并且是用户进入集群的入口。工作节点是大多数集群里的计算机,工作节点从主节点接受任务运行工作,工作通常是存储和取回数据或者运行特殊运用。一个分布式运算通过工作节点的并行分析运行。
HDFS 和 YARN都有数个在工作节点上协调工作服务的主服务。工作节点运行HDFS 和 YARN工作者服务。
对于HDFS,以下是主和工作服务:
-- NameNode(主): 存储文件系统的目录树,文件元数据,和集群里面的存储地址。客户端要使用HDFS首先得通过请求Namenode获得适合的存储节点的信息。
-- 第二NameNode(主):显示内置耗费任务和检查namenode的点。
在更高的层次上,当数据从HDFS获取, 客户运用必须从NameNode请求在硬盘定位数据。Namenode会回复存储DataNode的数据,另外客户端必须直接从DataNode请求数据块。
相似的,YARN 有以下数个主服务和工作服务:
-- 数据管理(主):分配和监视对于运用可以使用的集群资源和规划集群的任务;
-- 主运用(主):通过资源管理器协调运行在集群上的特殊运用;
-- Node管理器 (worker):在单独的节点运行和管理处理任务和汇报任务进展;
















