heibaiying的博客_Hadoop原创博文_51CTO博客

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

# Hadoop

Hadoop 系列（八）—— 基于 ZooKeeper 搭建 Hadoop 高可用集群

一、高可用简介Hadoop高可用(HighAvailability)分为HDFS高可用和YARN高可用，两者的实现基本类似，但HDFSNameNode对数据存储及其一致性的要求比YARNResourceManger高得多，所以它的实现也更加复杂，故下面先进行讲解：1.1高可用整体架构HDFS高可用架构如下：图片引用自：https://www.edureka.co/blog/how-to-set-u

Hadoop

ZooKeeper

原创 2019-09-17 13:04:00 743 阅读

Hadoop 系列（七）—— HDFS Java API

一、简介想要使用HDFSAPI，需要导入依赖hadoop-client。如果是CDH版本的Hadoop，还需要额外指明其仓库地址：<?xmlversion="1.0"encoding="UTF-8"?><projectxmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSche

Hadoop

原创 2019-09-17 13:02:40 454 阅读

Hadoop 系列（六）—— HDFS 常用 Shell 命令

1.显示当前目录结构#显示当前目录结构hadoopfs-ls<path>#递归显示当前目录结构hadoopfs-ls-R<path>#显示根目录下内容hadoopfs-ls/2.创建目录#创建目录hadoopfs-mkdir<path>#递归创建目录hadoopfs-mkdir-p<path>3.删除操作#删除文件hadoopfs-rm<pat

Hadoop

原创 2019-09-17 13:01:32 843 阅读

Hadoop 系列（五）—— Hadoop 集群环境搭建

一、集群规划这里搭建一个3节点的Hadoop集群，其中三台主机均部署DataNode和NodeManager服务，但只有hadoop001上部署NameNode和ResourceManager服务。二、前置条件Hadoop的运行依赖JDK，需要预先安装。其安装步骤单独整理至：Linux下JDK的安装三、配置免密登录3.1生成密匙在每台主机上使用ssh-keygen命令生成公钥私钥对：ssh-key

hadoop

原创 2019-09-16 08:55:44 1537 阅读

Hadoop 系列（四）—— Hadoop 开发环境搭建

一、前置条件Hadoop的运行依赖JDK，需要预先安装，安装步骤见：Linux下JDK的安装二、配置免密登录Hadoop组件之间需要基于SSH进行通讯。2.1配置映射配置ip地址和主机名映射：vim/etc/hosts#文件末尾增加192.168.43.202hadoop0012.2生成公私钥执行下面命令行生成公匙和私匙：ssh-keygen-trsa3.3授权进入~/.ssh目录下，查看生成的公

hadoop

原创 2019-09-16 08:54:49 498 阅读

Hadoop 系列（三）—— 分布式计算框架 MapReduce

一、MapReduce概述HadoopMapReduce是一个分布式计算框架，用于编写批处理应用程序。编写好的程序可以提交到Hadoop集群上用于并行处理大规模的数据集。MapReduce作业通过将输入的数据集拆分为独立的块，这些块由map以并行的方式处理，框架对map的输出进行排序，然后输入到reduce中。MapReduce框架专门用于<key，value>键值对处理，它将作业的输

Hadoop

MapReduce

原创 2019-09-13 17:50:47 1095 阅读

Hadoop 系列（二）—— 集群资源管理器 YARN

一、hadoopyarn简介ApacheYARN(YetAnotherResourceNegotiator)是hadoop2.0引入的集群资源管理系统。用户可以将各种服务框架部署在YARN上，由YARN进行统一地管理和资源分配。<divalign="center"><imgwidth="600px"src="https://raw

hadoop

yarn

原创 2019-09-13 17:48:20 1109 阅读

Hadoop 系列（一）—— 分布式文件系统 HDFS

一、介绍HDFS（HadoopDistributedFileSystem）是Hadoop下的分布式文件系统，具有高容错、高吞吐量等特性，可以部署在低成本的硬件上。二、HDFS设计原理<divalign="center"><imgwidth="600px"src="https://raw.githubusercontent.com/

hadoop

hdfs

原创 2019-09-11 14:46:25 500 阅读