hadoop学习笔记1---Hadoop体系介绍

原创

断臂人 2018-06-12 23:26:23 博主文章分类：hadoop ©著作权

©著作权归作者所有：来自51CTO博客作者断臂人的原创作品，请联系作者获取转载授权，否则将追究法律责任

1、Namenode

HDFS的守护进程

记录文件时如何分割成数据块的，以及这些数据块被存储到哪些节点上

对内存和I/O进行集中管理

是个单点，发生故障将使集群崩溃

2、Secondary Namenode

监控HDFS状态的辅助后台程序

每个集群都有一个

与NameNode进行通讯定期保存HDFS元数据快照

当NameNode故障可以作为备用NameNode使用

3、DataNode

每台从服务器都运行一个

负责把HDFS数据块读写到本地文件系统

4、JobTracker

用于处理作业（用户提交代码）的后台程序

决定有哪些文件参与处理，然后切割task并分配节点

监控task，重启失败的task（于不同的几点）

每个集群只有唯一一个JobTracker，位于Master节点

5、TaskTracker

位于slave节点上，与datanode结合（代码与数据一起的原则）

管理各自节点上的task（由jobtracker分配）

每个节点只有一个tasktracker，但一个tasktracker可以启动多个JVM，用于并行执行map或reduce任务

与jobtracker交互

1.6、Master和Slave

Master：Namenode、Secondary Namenode、jobtracker。浏览器（用于观看管理界面），其它Hadoop工具

Slave：Tasktracker、Datenode

Master不是唯一的

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯