Hadoop配置伪分布式

 

Hadoop海量数据存储,需要分布式存储,

Namenode:名称节点(NN),存放文件目录和路径,重要节点。有备份辅助节点

DataNode:数据节点(DN),存放数据,有副本

hadoop伪分布介绍 hadoop 伪分布式_hadoop

 

HDFS:分布式文件系统。

MapReduce:在分布式文件系统之上进行运算,海量数据并发运算,yarn他就是一个框架

hadoop伪分布介绍 hadoop 伪分布式_hadoop_02

 

1处是独立模式

2处是伪分布式模式

3处是完全分布式模式

 

①、如何配置伪分布式模式

首先进入找到hadoop文件,复制一份:

hadoop伪分布介绍 hadoop 伪分布式_xml_03

 

然后进入到备份后的hadoop-pseudo文件夹里,编辑后卫-site.xml的文件:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_04

※  编辑这三个

Core-site.xml核心文件:

 

<configuration>

<property>

 

<name>fs.defaultFS</name>

<value>hdfs://localhost/</value>

 

</property>

</configuration>

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_05

Hdfs-site.xml:文件系统

<configuration>

<property>

 

<name>dfs.replication</name>

<value>1</value>

 

</property>

</configuration>

hadoop伪分布介绍 hadoop 伪分布式_hadoop_06

Yarn-site.xml:框架

<configuration>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>localhost</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

hadoop伪分布介绍 hadoop 伪分布式_hadoop伪分布介绍_07

第四个文件,mapred-site.xml

复制mapred-site.xml.template复制后改名为mapred-site.xml,然后再gedit编辑,保存关闭:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_08

然后查看是否有ssh(安全访问技术),由图可看出已经存在有了:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_09

这个ssh完全不行的,我们还是要安装服务器版

查询一下,然后再进行安装:

hadoop伪分布介绍 hadoop 伪分布式_hadoop伪分布介绍_10

安装后查看会生成一个ssh-keygen文件密钥分为公钥public key和私钥private key

hadoop伪分布介绍 hadoop 伪分布式_hadoop伪分布介绍_11

hadoop伪分布介绍 hadoop 伪分布式_xml_12

然后我们可以自己生成一个密钥:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_13

然后我们可以查看有一个隐藏的.shh文件,然后cd进入.shh

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_14

hadoop伪分布介绍 hadoop 伪分布式_hadoop_15

然后把公钥放入授权认证的文件里:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_16

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_17

可以ssh试着登陆:

hadoop伪分布介绍 hadoop 伪分布式_xml_18

可查看感知到了一个主机known_hosts

hadoop伪分布介绍 hadoop 伪分布式_hadoop伪分布介绍_19

可以退出:

hadoop伪分布介绍 hadoop 伪分布式_hadoop伪分布介绍_20

如果再登陆的话就不提示要密码了:

hadoop伪分布介绍 hadoop 伪分布式_hadoop_21

然后我们可以对文件系统进行格式化,namenode就是放目录的节点:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_22

然后我们可以启动文件系统:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_23

再启动yarn(Hadoop资源管理器):

hadoop伪分布介绍 hadoop 伪分布式_xml_24

然后我们可以看一下进程jps:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_25

可以-l查看详细信息:

hadoop伪分布介绍 hadoop 伪分布式_xml_26

然后我们可以打开火狐浏览器输入localhost:50070或localhost:9870查看名称节点:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_27

或者输入localhost:8088查看资源管理器:

hadoop伪分布介绍 hadoop 伪分布式_hadoop_28

不用可以停止yarn和dfs:

hadoop伪分布介绍 hadoop 伪分布式_xml_29

关闭后为了方便创建目录和显示目录

还要重新启动起来

有一个指令统一启动dfs和yarn,就是all

hadoop伪分布介绍 hadoop 伪分布式_hadoop_30

为hadoop设置统一配置环境变量指定配置目录:

hadoop伪分布介绍 hadoop 伪分布式_Hadoop_31

没设置之前,都是显示其他用户的:

hadoop伪分布介绍 hadoop 伪分布式_xml_32

然后可以在hadoop下创建文件夹了:

hadoop伪分布介绍 hadoop 伪分布式_hadoop伪分布介绍_33

设置之后就可查看只有自己创建的了:

hadoop伪分布介绍 hadoop 伪分布式_hadoop_34