hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤

转载

柳随风 2023-11-13 13:03:12

文章标签 hadoop搭建伪分布式实验心得大数据 hadoop xml hdfs 文章分类 Hadoop 大数据

搭建hadoop单机环境（伪分布式）

一、准备工作

1.安装包下载：
2.创建一个新的虚拟机

二、解压安装jdk及hadoop
三、修改环境及配置文件

1.设置免密登录
2.配置jdk
3.配置hadoop

1）修改hadoop-env.sh
2）修改core-site.xml
3）修改hdfs-site.xml
4）修改mapred-site.xml.template
5）修改yarn-site.xml
6）配置hadoop环境变量
7)解压安装 hadoop-native-64-2.6.0.tar 包
8)格式化HDFS

四、启动和关闭
五、测试

1.启动hdfs、yarn、历史服务
2.网页端口测试

一、准备工作

1.安装包下载：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop

2.创建一个新的虚拟机

参考:
注：本机虚拟机IP地址设为： 192.168.209.129
主机名为：hadoop-single

hostnamectl set-hostname hadoop-single

设置主机列表：vi /etc/hosts

插入ip地址及主机名

192.168.209.129 hadoop-single

如下图所示：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop_02

虚拟机创建完成使用MobaXter创建ssh连接虚拟机

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop搭建伪分布式实验心得_03

二、解压安装jdk及hadoop

1.进入opt目录，创建文件夹software、install,将之前下载的安装包拖拽进文件夹software中，

cd /opt
mkdir software
madir install

如图：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_xml_04

2.解压安装，将安装包解压至install目录下

cd /software
tar -zxvf jdk-8u221-linux-x64.tar.gz -C /opt/install/
tar -zxvf hadoop-2.6.0-cdh5.14.2.tar.gz -C /opt/install/

3.将解压后的安装包重命名，简短的命名便于之后修改配置文件中的路径

cd /opt/install
mv jdk1.8.0_221/ jdk180
mv hadoop-2.6.0-cdh5.14.2/ hadoop260

三、修改环境及配置文件

1.设置免密登录

①：切换至家目录，生成私钥

cd
ssh-keygen -t rsa -P ""

需连续两次输入enter键

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop搭建伪分布式实验心得_05

②：复制私钥拷贝到公钥

cat /root/.ssh/id_rsa.pub > /root/.ssh/authorized_keys

③：给公钥授权，可读可写

chmod 600 /root/.ssh/authorized_keys

④：测试登录，自己登录自己，如不需要输入密码直接登录，则设置成功

ssh hadoop-single   #第一次切换需要输入yes
exit
ssh hadoop-single   #第二次切换不需要
exit

2.配置jdk

①修改系统环境变量

vi /etc/profile

输入 53 ，快速定位到该行，输入 i ，插入以下代码：

#此处路径为jdk安装的根目录
export JAVA_HOME=/opt/install/jdk180
export CLASSPATH=.:$JAVA_HOME/rt.jar:$JAVA_HOME/tools.jar:$JAVA_HOME/dt.jar
export JRE_HOME=$JAVA_HOME/jre
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

如下图：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop搭建伪分布式实验心得_06

按ESC键，输入冒号 x 保存退出

②：使环境变量生效

soucre /etc/profile

③：测试输入

java -version
javac

显示以下信息说明配置成功

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_xml_07

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_大数据_08

3.配置hadoop

切换至hadoop配置文件的文件夹，修改下图中5个配置文件

cd /opt/install/hadoop260/etc/hadoop

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop_09

1）修改hadoop-env.sh

vi hadoop-env.sh

修改下图中红框位置的jdk路径

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hdfs_10

修改为：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hdfs_11

2）修改core-site.xml

vi core-site.xml

插入以下代码：

<!-- 设置默认节点ip地址接口 -->
<property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.168.206.129:9000</value>
</property>

<!-- 设置用于存放hadoop临时文件的目录 -->
<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/install/hadoop260/tmp</value>
</property>

<!-- 设置允许其他主机root用户可以访问 -->
<property>
        <name>hadoop.proxyuser.root.hosts</name>
        <value>*</value>
</property>

<!-- 设置其他组下的root用户可以访问 -->
<property>
        <name>hadoop.proxyuser.root.groups</name>
        <value>*</value>
</property>

如下图所示：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hdfs_12

3）修改hdfs-site.xml

vi hdfs-site.xml

插入以下代码：

<!-- 设置数据块应该被备份的份数（单机设置为1，搭建集群时机器数最少为3，设置备份数为3即可） -->
<property>
        <name>dfs.replication</name>
        <value>1</value>
</property>

<!-- 设置免权限验证 -->
<property>
        <name>dfs.permissions.enabled</name>
        <value>false</value>
</property>

4）修改mapred-site.xml.template

复制 mapred-site.xml.template 重命名为 mapred-site.xml，并进行编辑

cp mapred-site.xml.template mapred-site.xml
vi mapred-site.xml

插入以下代码：

<!-- 设置mapreduce的工作模式：yarn -->
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>

<!-- 设置mapreduce的工作地址 -->
<property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoop-single:10020</value>
</property>

<!-- 设置web页面历史服务端口的配置 -->
<property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoop-single:19888</value>
</property>

5）修改yarn-site.xml

vi yarn-site.xml

插入以下代码：

<!-- reducer获取数据方式 -->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

<!-- 指定YARN的ResourceManager的地址 -->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop-001</value>
</property>

6）配置hadoop环境变量

vi /etc/profile

按 shift+g 定位到末行，输入o 进入编辑模式，插入以下代码：

#此处更改为hadoop的安装根目录
export HADOOP_HOME=/opt/install/hadoop260
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

使环境变量立即生效

source /etc/profile

7)解压安装 hadoop-native-64-2.6.0.tar 包

将 hadoop-native-64-2.6.0.tar 安装包解压安装到hadoop安装目录的lib目录和lib目录下的native目录即可（解压安装两次）,不然启动hadoop时会提示错误信息：

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable

cd /opt/software
tar -xvf hadoop-native-64-2.6.0.tar -C /opt/install/hadoop260/lib
tar -xvf hadoop-native-64-2.6.0.tar -C /opt/install/hadoop260/lib/native

如下图所示：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop_13

8)格式化HDFS

hadoop namenode -format

若显示信息都为INFO级别无报错信息，则格式化执行成功，如下图：

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_大数据_14

四、启动和关闭

启动hdfs和yarn：start-all.sh
关闭hdfs和yarn：stop-all.sh
启动hdfs：start-dfs.sh
关闭hdfs：stop-dfs.sh
启动yarn：start-yarn.sh
关闭yarn：stop-yarn.sh
启动历史服务：mr-jobhistory-daemon.sh start historyserver
关闭历史服务：mr-jobhistory-daemon.sh stop historyserver 注：第一次启动服务需输入yes确认

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_xml_15

五、测试

1.启动hdfs、yarn、历史服务

start-all.sh
mr-jobhistory-daemon.sh start historyserver

输入 jps 出现以下7个进程信息说明启动成功

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hadoop_16

2.网页端口测试

①：.输入：http://192.168.206.129:50070 若能出现如下页面说明hdfs启动成功

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hdfs_17

②：.输入：http://192.168.206.129:8088 若能出现如下页面说明yarn启动成功

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hdfs_18

③：.输入：http://192.168.206.129:19888 若能出现如下页面说明历史服务启动成功

hadoop搭建伪分布式实验心得搭建hadoop伪分布式环境步骤_hdfs_19

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：sql server复用子查询 sql的子查询

下一篇：Java 阿里人脸认证人脸识别阿里巴巴

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯