如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤

转载

mob64ca13f8b166 2024-08-30 15:50:03

文章标签 如何找到虚拟机hbase的安装路径分布式 linux hadoop hdfs 文章分类 Hbase 数据库

hadoop分布式集群搭建1主1从（含虚拟机安装教程）

1.搭建虚拟机

1. 新建虚拟机、并且配置虚拟机

2. Hadoop搭建

1. 安装java
2. 搭建hadoop运行环境

3. BUG集

1. 在hdfsWebUI查看数据目录会报这个错
2.可能在启动虚拟机时启动不成功出现错误`Failed to load SELinux policy freezing `

1.搭建虚拟机

下载VMware软件使用软件搭建 VMware官网（傻瓜式安装）

1. 新建虚拟机、并且配置虚拟机

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_02

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_03

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_04

这里要选择你所下载的iso镜像我的版本是center os 7 这是我的镜像地址在百度网盘（）

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_05

全名：虚拟机登录界面显示的名称（随意）
用户名：设置用户名（例：angzush_）此用户名需跟后续进入linux设置的一致，不然无法切换root用户
密码：设置用户密码（例：123456）此密码需跟后续进入linux设置的一致

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_06

虚拟机名称：随意命名
位置：虚拟机搭建的位置建议别在c盘

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_07

处理器和处理器内核数、根据自己电脑配置来

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_08

给虚拟机分配内存根据自己电脑配置来（一般不要低于1g）

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_09

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_10

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_linux_11

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_12

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_13

自己根据分配磁盘大小我的是100g

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_14

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_linux_15

点击自定义硬件配置指向iso映像文件

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_16

然后点击完成自启动（在这一步一些电脑会出现这个bug）

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_17

这个问题是因为本地电脑未支持虚拟机需要开启支持（重启电脑然后按F2进入BIOS界面一些电脑在Configuration选项里有 intel virtual technology 选项将Disabled 改为 Enabled）

例：

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_18

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_19

然后按F10保存启动就行了重新打开VMware开启虚拟机

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_20

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_21

进入user 创建用户

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_22

用户一定要和之前在虚拟机创建的一致、我这勾选了Make this user administrator 意思是让该用户拥有admin的权限、然后双击DONE

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_23

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_24

这就算安装完成了、输入密码直接进入（例：123456）

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_25

然后右键 openTerminal 打开控制台、输入ifconfig查看IP地址

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_26

我的ip地址是192.168.11.130、然后用本地电脑ping 这个ip看是否能ping通、接着用虚拟机控制台ping 百度看是否有网

// 在本地电脑DOS命令行ping虚拟机ip 
ping 192.168.11.130
// 在虚拟机控制台ping 百度
ping www.baidu.com

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_27

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_28

出现以上两种代表成功、接下来需要给虚拟机快照

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_29

使用拍摄快照将虚拟机环境保存下来

2. Hadoop搭建

1. 安装java

在java官网下载 Java官网

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_30

然后用xshell 拉入到Linux root目录下

（xshell、xftp下载地址）链接：https://pan.baidu.com/s/1WSun7g70e9LCdpsUkaTJuA 提取码：0326然后在xshell中解压jdk安装包、tar -zxvf 安装包名称 ,接着使用 mv命令将jdk文件夹移动到 /usr/local 下、并将文件夹名称改为java、所以java的路径为 /usr/local/java

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_31

然后修改全局环境 vim/etc/profile 在最下面添加export

#this is for java environment
export JAVA_HOME=/usr/local/java
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JRE_HOME=$JAVA_HOME/jre

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_linux_32

#重新加载文件
source /etc/profile

使用 java、javac、java -version 查看环境搭建是否正确

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_33

2. 搭建hadoop运行环境

使用 hostname 查看主机名称

如果不是master建议将主服务器名修改为master

从服务器改为slave1

#使用该命令
sudo hostnamectl set-hostname master
sudo hostnamectl set-hostname slave1

修改host文件

vim /etc/hosts

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_34

添加主服务器IP、和从服务器IP及名称

例：192.168.11.128 master

192.168.11.129 slave1

ssh免密登录配置
首先在master上运行、接着一直回车生成密钥

ssh-keygen -t rsa

然后将密钥加入到 authorized_keys 文件中

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

然后将authorized_keys文件发送到slave1机器上

scp authorized_keys root@192.168.11.129:/root/.ssh/

接着在slave1服务器中重复上面的命令、要将生成的authorized_keys文件发送到master服务器/root/.ssh里
然后使用 ssh主机名来切换（第一次是需要输入yes但不需要输入密码）

#切换到slave1
ssh slave1
#切换到master
ssh master

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_linux_35

下载Hadoop版本(我下载的是3.3.2版本) Hadoop下载地址

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_36

配置Hadoop环境变量
解压文件、放到/usr/local/改名为hadoop（不一定要是这个位置、最好放在已挂载的data数据文件夹下，这里只是演示用）
然后配置环境变量

#我的目录是 /usr/local/hadoop 不一定要是这个位置、最好放在已挂载的data数据文件夹下，这里只是演示用
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop

配置Hadoop文件：

文件	作用
workers	记录所有的数据节点的主机名或 IP 地址
core-site.xml	Hadoop 核心配置
hdfs-site.xml	HDFS 配置项
mapred-site.xml	MapReduce 配置项
yarn-site.xml	YRAN 配置项

修改core-site.xml

vim ${HADOOP_HOME}/etc/hadoop/core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/data/hadoop/hdfs/tmp</value>
        <description>临时存储目录，修改为自己想放的地方、前提是文件夹已被创建</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
        <description>hdfs默认地址与端口</description>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131702</value>
    </property>
</configuration>

修改hdfs-site.xml

vim ${HADOOP_HOME}/etc/hadoop/hdfs-site.xml

<configuration>
<property>
    <name>dfs.namenode.name.dir</name>
        <value>file:/data/hadoop/hdfs/name</value>
        <description>namenode上存储hdfs名字空间元数据 </description>
     </property>
     <property><!--DataNode存放块数据的本地文件系统路径-->
         <name>dfs.datanode.data.dir</name>
         <value>file:/data/hadoop/hdfs/data</value>
         <description>datanode上数据块的物理存储位置</description>
     </property>
     <property><!--数据需要备份的数量，不能大于集群的机器数量，默认为3-->
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>slave1:50090</value>
        <description>这个主机名设置哪个节点，SecondaryNameNode就启动在哪个服务器上</description>
    </property>
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
        <property>
        <name>dfs.client.use.datanode.hostname</name>
        <value>true</value>
        <description>only cofig in clients</description>
    </property>
</configuration>

修改Mapred-site.xml

vim ${HADOOP_HOME}/etc/hadoop/mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=/data/hadoop/mapreduce</value>
    </property>
    <property>
        <name>mapreduce.map.env</name>
        <value>HADOOP_MAPRED_HOME=/data/hadoop/mapreduce/map</value>
    </property>
    <property>
        <name>mapreduce.reduce.env</name>
        <value>HADOOP_MAPRED_HOME=/data/hadoop/mapreduce/reduce</value>
    </property>
</configuration>

修改Yarn-site.xml

vim ${HADOOP_HOME}/etc/hadoop/yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    <description>The hostname of the RM.修改为主节点主机名</description>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!-- 因为我是虚拟机可能内存会不够 -->
    <property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
    </property>
</configuration>

然后在 hadoop-env.sh、mapred-env.sh、yarn-env.sh文件中各添加javahome

export JAVA_HOME=/usr/local/java

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_37

在workers文件中填写主机名，主从都写

vim ${HADOOP_HOME}/etc/hadoop/workers

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_38

进入Hadoop sbin目录下 cd ${HADOOP_HOME}/sbin 添加start-dfs.sh、stop-dfs.sh头部配置

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs 
HDFS_NAMENODE_USER=root 
HDFS_SECONDARYNAMENODE_USER=root

给start-yarn.sh、stop-yarn.sh添加头部配置

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

然后执行 hadoop version 查看版本信息

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_39

这是给master配置好了然后咱们再配置slave1

将Hadoop整体文件夹拷贝到slave1

scp /usr/local/hadoop root@192.168.11.129:/usr/local/

修改 /etc/profile 环境变量、添加之前再master配置的内容、或者可以直接将master 的 proflie文件放到slave1虚拟机上然后重新加载环境

slave1配置完成后切换到master格式化hdfs

hdfs namenode -format

启动hdfs和yarn

#启动hdfs
start-dfs.sh
#关闭hdfs
stop-dfs.sh

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_linux_40

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_如何找到虚拟机hbase的安装路径_41

#启动yarn
start-yarn.sh
#关闭yarn
stop-yarn.sh

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_42

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_linux_43

此刻代表Hadoop 启动成功、接下来咱们访问Hadoop的webUi界面hdfsWebUi：http://ip:9870

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_44

yarnWebUi：http://ip:8088

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_45

3. BUG集

1. 在hdfsWebUI查看数据目录会报这个错

Failed to retrieve data from /webhdfs/v1/?op=LISTSTATUS: Server Error

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hdfs_46

这是因为java 11以后移除了javax.activation**、咱们需要将jar包放入Hadoop/share/hadoop/common 下

jar包位置:https://jar-download.com/?search_box=javax.activation

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_47

下载解压后放到 cd ${HADOOP_HOME}/share/hadoop/common/ master和slave1 都要、然后重启虚拟机就行

2.可能在启动虚拟机时启动不成功出现错误`Failed to load SELinux policy freezing`

解决方案：在启动时按e grub编辑页面

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_48

通过键盘的向上或向下箭头，找到linux16那行在LANG=zh_CN.UTF-8 空格加上 selinux=0或者 enforcing=0（我是第一个就解决问题了）

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_分布式_49

不要退出页面，在此处使用Ctrl+x启动，之后等会就会看到熟悉的页面了。要说一点的是，可能会在下图所示页面卡顿一会，等会就行了进入系统之后记得把配置修改正确。

Step1: 使用su命令进入管理员权限；

Step2: 修改配置文件/etc/selinux/config/中的“SELINUX”参数

如何找到虚拟机hbase的安装路径虚拟机安装hadoop3步骤_hadoop_50

SELINUX=disable
SELINUXTYPE=targeted

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：如何在IDE中安装yarn ideac安装

下一篇：python安装pywt库清华大学的源 python 清华源

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯