Hadoop核心HDFS——HDFS概念及优缺点

关注南瓜数据客栈

Hadoop核心HDFS——HDFS概念及优缺点

原创

南瓜数据客栈 2021-08-05 13:55:44 博主文章分类：大数据 ©著作权

文章标签 HDFS hadoop 大数据 hdfs 数据块 文章分类 数据库

©著作权归作者所有：来自51CTO博客作者南瓜数据客栈的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hadoop：

Hadoop是一个开源的大数据框架
Hadoop是一个分布式计算的解决方案
Hadoop = HDFS(分布式文件系统)+MapReduce(分布式计算)

Hadoop核心

HDFS 分布式文件系统：存储是大数据技术的基础

MapReduce编程模型：分布式计算是大数据应用的解决方案

HDFS总结

普通的成百上千的机器
按TB甚至PB为单位的大量的数据
简单便捷的文件获取

Hadoop基础架构

HDFS概念

数据块
NameNode
DataNode

数据块

数据块是抽象块而非整个文件作为存储单元
默认大小为64MB，一般设置为128M，备份x3

Hadoop核心HDFS——HDFS概念及优缺点_hadoop

NameNode

管理文件系统的命名空间，存放文件元数据
维护着文件系统的所有文件和目录，文件与数据块的映射
记录每个文件中各个块所在数据节点的信息

DataNode

存储并检索数据块
向NameNode更新所存储块的列表

HDFS优点

适合大文件存储，支持TB、PB级的数据存储，并有副本策略
可以构建在廉价的机器上，并有一定的容错和恢复机制
支持流式数据访问，一次写入，多次读取最高效

HDFS缺点

不适合大量小文件存储
不适合并发写入，不支持文件随机修改
不支持随机读等低延时的访问方式

赞
收藏
评论
分享
举报

上一篇：hive与mysql对比之max、group by、日志分析

下一篇：mysql运算符——算术运算符、比较运算符、逻辑运算符、位运算符

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册