hadoop组建hue执行sql很慢 hadoop搭建成功

转载

mob6454cc667b1d 2023-09-20 10:28:31

文章标签 hadoop组建hue执行sql很慢 hadoop Hadoop xml 文章分类 Hadoop 大数据

hadoop集群搭建四 hadoop高可用集群的安装

实验需要的 .xml文件模板在下载区可下载

一、实验准备

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢

二、Hadoop基本安装配置

该项操作均在集群用户admin下进行，只在一台主机上进行操作其他的主机进行同步安装与步骤

#mkdir ~/hadoop

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_02

#cd hadoop
#tar -xzf ~/setups/hadoop-2.7.3.tar.gz

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_03

配置hadoop相关变量

#vi ~/.bash_profile

在文件末尾添加

#hadoop environment
HADOOP_HOME=/home/admin/hadoop/hadoop-2.7.3
PATH= $ HADOOP_HOME/bin:$ HADOOP_HOME/sbin:$PATH
export HADOOP_HOME PATH

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_04

使环境变量立即生效

#source /.bash_profile

查看是否配置成功

#echo $HADOOP_HOME
#echo $PATH

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_05

三、Hadoop高可用完全分布模式配置

#cd ~hadoop
#mkdir tmp name data journal

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_06

进入hadoop配置文件所在位置修改配置文件

#cd ~/hadoop/hadoop-2.7.3/etc/hadoop

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_07

#vi hadoop-env.sh

找到下列代码取消注释，注意顶格，具体添加以本机jdk路径为准

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_08

#vi core-site.xml

添加下列内容

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_09

#vi hdfs-site.xml

添加下列内容

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_10

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_11

拷贝配置文件

#cp mapred-site.xml.template mapred-site.xml

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_12

#vi mapred-site.xml

添加一下内容

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_13

#vi yarn-env.sh

找到下列代码取消注释，注意顶格，具体添加以本机jdk路径为准

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_14

#vi yarn-site.xml

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_15

#vi slaves

将原文件中的locahost改为下列内容

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_16

备注:如果你要把主节点和主节点备用节点同时作为数据节点使用，也是可以的，这里加上01和02即可。后面配置要一致。

四、同步安装和配置

该项的所有操作步骤使用专门用于集群的用户admin进行。

将“hadoop”目录和‘.bash_ profile" 文件发给集群中所有主机，发送目标用户为集群专用用户admin,发送目标路径为“/home/admin”，即集群专用用户admin的家目录。

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_17

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_18

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_19

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_20

注意将文件发送过去之后，必须先使配置文件生效
#source /.bash_profile

查看是否配置成功

#echo $HADOOP_HOME
#echo $PATH
#hadoop version

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_21

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_22

五、Hadoop高可用完全分布模式格式化和启动

注意本节格式化操作不可多次执行，多次执行可能导致id不一致在所有同步通信节点的主机执行，启动同步通信服务，然后使用命令“jps"查看Java进程信息，若有名为“JournalNode"的进程，则表示同步通信节点启动成功。本操作只在第-一次安装时执行。安装完成后，以及关机重启服务

器后不需要再次执行。

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_23

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_24

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_25

在主节点执行

#hadoop namenode -format

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_26

格式化完成后将“hadoop"目录下的“name"目录发给集群中所有备用主节点的主机，发送目标用户为集群专用用户admin,即当前与登录用户同名的用户，发送目标路径为“home/admin/hadoop" ，即集群专用用户admin家目录下的Hadoop相关文件的目录。

#scp -r ~/hadoop/name admin@cluster-02:/home/admin/hadoop

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_27

查看集群zookeeper服务之前先将每台主机的zookeeper服务启动后查看

#zkServer.sh start
#zkServer.sh status

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_28

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_29

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_30

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_31

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_32

由图可知leader为一号主机，在上次实验中leader为三号主机。说明leader并不是一成不变的。

在主节点使用命令,对Hadoop集群在Zookeeper中的主节点切换控制信息进行格式化，若格式化过程中没有报错则表示格式化成功。格式化之前确保集

群中各主机Zookeeper开启。

注:本操作只在第-一次安装时执行。安装完成后，以及关机重启服务器
后不需要再次执行。不要重复格式化。

#hdfs zkfc -formaZK

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_33

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_34

在所有同步通信节点的主机，使用此命令，关闭同步通信服务。

注:本操作只在第一次安装时执行。安装完成后，以及关机重启服务器后不需要再次执行.

#hadoop-daemon.sh stop journode

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_35

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_36

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_37

在主节点启动hadoop

#start-all.sh

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_38

在备用主节点启动yarn

#yarn-daemon.sh start resourcemanager

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_39

在主节点使用命令“jps’”查看Java进程信息，若有名为“NameNode"、“ ResourceManager”、“DFSZKFailoverController"的三个进程，则表示Hadoop集群的主节点启动成功。

hadoop组建hue执行sql很慢 hadoop搭建成功_xml_40

由图可知，主节点与备用节点的进程信息服务相同。

使用命令“ssh目标主机名或IP地址”远程登录到所有数据节点主机，使用命令“jps" 查看Java进程信息，若有名为“DataNode"、“NodeManager"、“ JournalNode"的三个进程，则表示Hadoop集群的数据节点启动成功。

ssh远程登录时不需要密码

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_41

由图可知，所有数据节点主机的进程信息服务相同。

六、Hadoop高可用完全分布模式验证

在hadoop中创建当前登录用户自己的目录

#hadoop fs -mkdir -p /user/admin
#hadoop fs -ls -R /

hadoop组建hue执行sql很慢 hadoop搭建成功_Hadoop_42

#cd ~/hadoop/hadoop-2.7.3/share/hadoop/mapreduce
#hadoop jar hadoop-mapreduce-examples-2.7.3.jar pi 2 1000

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_43

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop组建hue执行sql很慢_44

在每次实验后注意实验备份

hadoop组建hue执行sql很慢 hadoop搭建成功_hadoop_45

关机时可以选择ssh远程关机

（1）在利用CRT进行虚拟机连接时发现无法连接。解决方案：关闭所有主机重新还原虚拟机网络编辑器中的NAT模式，重新设置后，在windows10中添加VM8ip地址并验证与虚拟机通信正常后，在虚拟机中检查是否相互通信正常。
（2）在关机时可以利用一台主机关闭所有虚拟机。利用ssh命令。在实验配置时可以高效通过ssh、scp命令进行配置，简化实验配置过程。

总结：
通过本次实验使我深刻理解了虚拟机外网和内网的区别，外网正常通信可以保证在线下载软件包正常，而内网通信正常则可以保证XFTP与CRT连接正常。
在本节知识学习中使我更清晰认识到完全分布模式的工作原理、组成。Hadoop的集群有两大类角色: Master和Slave。一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中NameNode作为主服务器，管理文件系统的命名空间和客户端对文件系统的访问操作;集群中的DataNode管理存储的数据。HDFS和MapReduce共同组成了Hadoop分布式系统体系结构的核心。HDFS在集群上实现分布式文件系统，MapReduce在集群上实现了分布式计算和任务处理。HDFS在MapReduce任务处理过程中提供了文件操作和存储等支持，MapReduce 在HDFS的基础上实现了任务的分发、跟踪、执行等工作，并收集结果，二者相互作用。
学会了在遇到问题时通过提示及已做过的实验自己解决问题，并帮助同学排错的过程中，熟练掌握了如何有效通过查看日志文件找出配置错误。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。