hdfs怎么查看副本数是多少 hdfs 副本数

关注 mob6454cc74c0fc

文章目录

写文件（create) 过程
读文件过程
说明
1. 机架感知（副本存储节点选择）
2. 网络拓扑（节点距离计算）
背景：
计算机制
参考

hdfs怎么查看副本数是多少 hdfs 副本数

转载

mob6454cc74c0fc 2024-06-04 20:26:54

文章标签 hdfs怎么查看副本数是多少客户端上传 hdfs 文章分类 架构后端开发

写文件（create) 过程

hdfs客户端通过DistributedFileSystem模块调用create() 来新建文件，对namenode创建一个RPC调用，请求在系统的命名空间中新建一个文件。
namenode检查是否有此目录，以及是否客户有权限，通过则创建新文件，并向客户端返回一个FSDataOutPutStream对象
客户端请求上传第一个block到哪几个DataNode上，namenode返回三个节点
客户端通过FSDataOutPutStream对象请求dn1上传数据，然后逐级调用，逐级应答，建立完成通信管道
客户端开始上传第一个block，以Packet（64k)形式传输数据，datanode1收到一个就会传给下一个，每传一个就会放入一个应答队列等待应答
当一个block传输完成后，再传输其他的，重复执行3-5步

读文件过程

hdfs客户端通过DistributedFileSystem，通过rpc调用namenode确定文件起始块位置，NameNode通过查询元数据，找到文件块所在的datanode地址，按照与客户端距离来排序。
客户端对于每一个块都选择一个距离最近的datanode来读数据
datanode以packet为单位来传输数据
客户端通过FSInputStream模块以packet形式接受，先在本地做缓存，然后写入目标文件

说明

1. 机架感知（副本存储节点选择）

原因：为了平衡数据的可靠性和写操作的花费

方法：默认副本数为3；

第一个副本在Client所处的节点上，若客户端在集群外，随机选一个；
第二个副本在另一个机架的随机一个节点
第三个副本在第二个副本所在机架的随机节点

注：NameNode不允许DataNode有两个相同的块，所以最大副本数量可根据DataNode数量决定。

2. 网络拓扑（节点距离计算）

背景：

读数据过程中，NameNode会将排序后的datanode地址发送给客户端，那么是如何排序的呢？

计算机制

两个节点的距离是他们到最近共同祖先的距离总和

hdfs怎么查看副本数是多少 hdfs 副本数_客户端

参考

尚硅谷大数据视频
Hadoop权威指南

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：unity3d 类函数继承关系 unity函数执行顺序

下一篇：python有没有ggcorrplot python有没有手机版

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册