哪项技术不依赖hadoop 下面哪一项不是hadoop的特性?

关注 mob6454cc63081f

文章目录

hadoop介绍
2.Shuffle过程详解
3.Hadoop 中序列化机制的特点
4.Mapreduce性能优化
小文件问题

哪项技术不依赖hadoop 下面哪一项不是hadoop的特性?

转载

mob6454cc63081f 2024-05-20 07:02:49

文章标签 哪项技术不依赖hadoop hadoop 学习大数据 Powered by 金山文档 文章分类 Hadoop 大数据

hadoop介绍

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统（ Distributed File System），其中一个组件是HDFS（Hadoop Distributed File System）。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求，可以以流的形式访问（streaming access）文件系统中的数据。Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，而MapReduce则为海量的数据提供了计算。以下为hadoop三大组件

HDFS 文件系统，负责海量数据的分布式存储
yarn 集群资源的管理和调度
mapReduce 计算模型，负责海量数据的分布式计算

官方版&发行版

Apache Hadoop：官方版本，开源
Cloudera Hadoop(CDH):商业版本，提供技术支持，界面操作，方便集群运维管理
HortonWorks（HDP）：开源，提供界面，方便运维管理，目前HDP已被CDH收购

2.Shuffle过程详解

网络拷贝的过程，指通过网络把数据从Map端拷贝到Reduce端的一个过程。

哪项技术不依赖hadoop 下面哪一项不是hadoop的特性?_哪项技术不依赖hadoop

3.Hadoop 中序列化机制的特点

紧凑：高效实用存储空间
快速：读写数据的额外开销小
可扩展：可透明读取老格式的数据
互操作：支持多语言的交互

InputFormat分析

哪项技术不依赖hadoop 下面哪一项不是hadoop的特性?_Powered by 金山文档_02

OutputFormat分析

哪项技术不依赖hadoop 下面哪一项不是hadoop的特性?_学习_03

4.Mapreduce性能优化

小文件问题

Hadoop的HDFS和MapReduce框架是针对大数据文件来设计的，在小文件的处理上不但效率低下，而且十分消耗内存资源

SequeceFile

哪项技术不依赖hadoop 下面哪一项不是hadoop的特性?_哪项技术不依赖hadoop_04

MapFile

MapFile是排序后的SequenceFile,MapFile由两部分组成，分别是index和data。
index作为文件的数据索引，主要记录了每个Record的key值，以及该Record在文件中的偏移位置。
在MapFile被访问的时候，索引文件会被加载到内存，通过索引映射关系可迅速定位到指定Record所在文件位置。

hadoop jar hdfsdemo-1.0-SNAPSHOT-jar-with-dependencies.jar mapreduce/WordCountJob /seqFile /out

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：Kubernetes最新版 kubernetes下载

下一篇：Android 如何区分png和apng 安卓手机png格式图片

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册