HDFS架构

关注 mb607022e25a607

HDFS架构

转载

mb607022e25a607 2020-02-20 15:50:00

文章标签 HDFS架构（ 文章分类 架构后端开发

HDFS架构（Master-Slave）

几个进程的角色

nameNode（master）：用于保存、管理、持久化文件的元数据（文件名、文件副本数、文件块大小、文件块列表），同时还要接收客户端的文件读写请求。
secondaryNameNode：用于实时同步文件元数据，给nameNode服务做副本，担当高可用备份，nameNode处于正常状态时secondaryNameNode只sandBy。
dataNode（slave）：真正存储文件块，分布在每个节点上。
dfsClient：向hdfs发请求，当用户发起一个hdfs文件读、写、查询等请求时，集群都会启动一个dfsClient进程，dfsClient先访问nameNode获取文件元数据，然后根据元数据解析出文件分片的分布情况，最后去各dataNode完成真正的读写。它扮演着用户与hdfs交互中间人的角色，同时文件的拆分和拼装也是在dfsClient进程完成的。

HDFS文件读写流程

读取：系统接收到用户读请求后，首先启动一个dfsClient进程，这个进程拿着用户传递的文件路径等信息，传递给nameNode，nameNode返回文件分片的分布节点列表，dfsClient就近读取文件分片，并将各分片拼装为完整文件返回给用户。
写入：系统接收到用户写请求后，首先启动一个dfsClient进程，这个进程将写入文件的信息提交给nameNode，nameNode根据集群情况将文件进行分片和位置规划，再将规划信息返回给dfsClient，dfsClient根据规划信息将文件切分成特定的块，然后根据位置规划分别与对应的dataNode建立管道，将分片传输到对应的dataNode上。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：关于索引我能说的那些事儿

下一篇：SQL查询结果自定义排序

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册