基于ZooKeeper的Hadoop HA集群搭建

原创

奔跑的奔奔 2018-01-25 20:58:18 博主文章分类：大数据 ©著作权

文章标签 大数据 HDFS的HA ZooKeeper 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者奔跑的奔奔的原创作品，谢绝转载，否则将追究法律责任

集群的规划

Zookeeper集群：

192.168.142.12 （bigdata12）

192.168.142.13 （bigdata13）

192.168.142.14 （bigdata14）

Hadoop集群：

192.168.142.12 （bigdata12） NameNode1 ResourceManager1 Journalnode

192.168.142.13 （bigdata13） NameNode2 ResourceManager2 Journalnode

192.168.142.14 （bigdata14） DataNode1 NodeManager1

192.168.142.15 （bigdata15） DataNode2 NodeManager2

1、准备工作：

（1）、关闭防火墙：

查看防火墙的状态： systemctl status firewalld.service

关闭防火墙： systemctl stop firewalld.service

禁用防火墙（永久）：systemctl disable firewalld.service

（2）、安装JDK及配置环境变量

tar -zxvf jdk-8u144-linux-x64.tar.gz -C ~/training/

设置环境变量：vi ~/.bash_profile

JAVA_HOME=/root/training/jdk1.8.0_144

export JAVA_HOME

PATH=$JAVA_HOME/bin:$PATH

export PATH

生效环境变量: source ~/.bash_profile

（3）、安装Hadoop及设置环境变量：

解压：tar -zxvf hadoop-2.7.3.tar.gz -C ~/training/

设置环境变量：

vi ~/.bash_profile

HADOOP_HOME=/root/training/hadoop-2.7.3

export HADOOP_HOME

PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export PATH

生效环境变量:

source ~/.bash_profile

（4）、设置免密码登录：

a、生成密钥：

ssh-keygen -t rsa

（存储在~/.ssh目录）

b、分发公钥：

ssh-copy-id -i /root/.ssh/id_rsa.pub root@bigdata12

c、验证：
ssh bigdata12

（5）、配置主机名：/etc/hosts文件

vi /etc/hosts

192.168.157.11 bigdata11

2、安装配置ZooKeeper集群：参考“ZooKeeper安装说明”

3、配置Hadoop集群：（在bigdata12上安装）

（1）修改hadoop-env.sh文件：（在bigdata12上执行）

export JAVA_HOME=/root/training/jdk1.8.0_144

（2）修改core-site.xml文件：（在bigdata12上执行）

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/root/training/hadoop-2.7.3/tmp</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>bigdata12:2181,bigdata13:2181,bigdata14:2181</value>

</property>

</configuration>

（3）修改hdfs-site.xml（在bigdata12上执行）

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.ns1</name>

</property>

<name>dfs.namenode.rpc-address.ns1.nn1</name>

<value>bigdata12:9000</value>

</property>

<name>dfs.namenode.http-address.ns1.nn1</name>

<value>bigdata12:50070</value>

</property>

<name>dfs.namenode.rpc-address.ns1.nn2</name>

<value>bigdata13:9000</value>

</property>

<name>dfs.namenode.http-address.ns1.nn2</name>

<value>bigdata13:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://bigdata12:8485;bigdata13:8485;/ns1</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/root/training/hadoop-2.7.3/journal</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.ns1</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<!--为什么HA的实现，需要配置隔离机制??

如果没有隔离机制，会造成脑裂的问题：由于某种原因（FailOverController与NameNode通信出现问题，FailOverController的到的是错误信息），造成存在多个active的NameNode,这时DataNode就会发生脑裂问题，不知道谁是真正的NameNode。

-->

<name>dfs.ha.fencing.methods</name>

<value>

sshfence

shell(/bin/true)

</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.ha.fencing.ssh.connect-timeout</name>

</property>

</configuration>

（4）、修改mapred-site.xml文件（在bigdata12上执行）

<name>mapreduce.framework.name</name>

</property>

</configuration>

（5）、修改yarn-site.xml文件（在bigdata12上执行）

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>bigdata12</value>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>bigdata13</value>

</property>

<name>yarn.resourcemanager.zk-address</name>

<value>bigdata12:2181,bigdata13:2181,bigdata14:2181</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

（6）、修改slaves文件（/root/training/hadoop-2.7.3/etc/hadoop），设置从节点

bigdata14

bigdata15

（7）、创建目录（在bigdata12上执行）

/root/training/hadoop-2.7.3/tmp

/root/training/hadoop-2.7.3/journal

（8）、将配置好的hadoop拷贝到其他节点

scp -r /root/training/hadoop-2.7.3/ root@bigdata13:/root/training/

scp -r /root/training/hadoop-2.7.3/ root@bigdata14:/root/training/

scp -r /root/training/hadoop-2.7.3/ root@bigdata15:/root/training/

（8）、启动ZooKeeper集群

zkServer.sh start

（9）、单独启动启动journalnode（bigdata12和bigdata13）

hadoop-daemon.sh start journalnode

（10）NameNode节点格式化HDFS（在bigdata12上执行）

hdfs namenode -format

（11）拷贝bigdata12的dfs目录到bigdata13

/root/training/hadoop-2.7.3/tmp/dfs拷贝到bigdata13的/root/training/hadoop-2.7.3/tmp

scp -r dfs/ root@bigdata13:/root/training/hadoop-2.7.3/tmp

（12）、格式化ZooKeeper（在bigdata12上执行）

hdfs zkfc -formatZK

日志：INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns1 in ZK.

（13）、启动Hadoop集群（在bigdata12或 bigdata13上执行）

start-all.sh

（14）、单独启动ResourceManager（bigdata12或 bigdata13上执行，取决于待启动）

yarn-daemon.sh start resourcemanager

上一篇：Linux的tar命令使用简介

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯