Ubantu20下Hadoop伪分布安装

注意:防火墙一定要关闭!,也可以不关闭 ,需要放行你需要的端口!

1、准备安装包上传到/opt目录下

  • 配置jdk,将jdk上传到/opt目录下

上传失败执行

sudo chmod 777 /opt

ubtun安装hadoop ubuntu20安装hadoop_ubtun安装hadoop

hadoop获取连接,在/opt目录下输入

sudo wget --no-check-certificate https://mirrors.bfsu.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
  • 将两者解压到/usr/local下
sudo tar -zxvf /opt/hadoop-2.10.1.tar.gz -C /usr/local/           
sudo tar -zxvf jdk-8u131-linux-x64.tar.gz -C /usr/local/
  • 编辑sudo vim /etc/profile,vim没有该命令自行百度(JDK和hadoop环境变量一起)
export JAVA_HOME=/usr/local/jdk1.8.0_131
export HADOOP_HOME=/usr/local/hadoop-2.10.1
exportPATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$PATH:$HOME/bin
  • 保存退出执行 source /etc/profile
  • 检测是否成功,分别输入
java -version
hadoop

ubtun安装hadoop ubuntu20安装hadoop_vim_02

2、hadoop配置

  • hadoop-env.sh文件的配置

配置文件所在目录,在解压的hadoop目录下:hadoop/hadoop-2.10.1/etc/hadoop

sudo vim  hadoop-env.sh

ubtun安装hadoop ubuntu20安装hadoop_linux_03

这个目录改Jdk的安装目录,不用到bin目录下,到安装目录即可

/usr/local/jdk1.8.0_131

ubtun安装hadoop ubuntu20安装hadoop_hadoop_04

  • core-site.xml文件配置
sudo vim core-site.xml

ubtun安装hadoop ubuntu20安装hadoop_hadoop_05

<configuration>
      <property>
            <name>fs.defaultFS</name>
            <value>hdfs://localhost:9000</value>
            </property>
            <property>
             <name>hadoop.tmp.dir</name>
          <value>/home/icloudy/hadoop/hadoop-2.10.1/tmp</value>
     </property>

</configuration>

可根据自己情况更改。

  • 配置hdfs-site.xml
sudo vim hdfs-site.xml

ubtun安装hadoop ubuntu20安装hadoop_hadoop_06

<configuration>
                <property>
                        <name>dfs.replication</name>
                        <value>1</value>
                </property>
</configuration>
  • mapred-site.xml文件配置

目录下是没有该文件的只有一个模板,将mapred-site.xml.template复制一份改名即可。

cp mapred-site.xml.template mapred-site.xml
sudo vim mapred-site.xml
<configuration>
        <property>
                  <name>mapreduce.framework.name</name>
                 <value>yarn</value>
        </property>
</configuration>

ubtun安装hadoop ubuntu20安装hadoop_hadoop_07

  • yarn-site.xml文件配置
sudo vim yarn-site.xml

ubtun安装hadoop ubuntu20安装hadoop_ubtun安装hadoop_08

<property>
             <name>yarn.nodemanager.aux-services</name>
             <value>192.168.66.123:9001</value>
    </property>

    <property>
             <name>yarn.resourcemanager.address</name>
             <value>192.168.66.123:8032</value>
    </property>
  • 配置ssh免密登录

进入 /etc下

sudo chmod 777 hosts

sudo vim /etc/hosts

ubtun安装hadoop ubuntu20安装hadoop_hadoop_09

ubtun安装hadoop ubuntu20安装hadoop_vim_10

ubtun安装hadoop ubuntu20安装hadoop_linux_11

完成主机ip映射之后使用密码实现主机间的切换:ssh root@[主机映射名称]

cd ~/.ssh/

#完成主机ip映射之后使用密码实现主机间的切换:ssh root@[主机映射名称]
ssh root@icloudy

ubtun安装hadoop ubuntu20安装hadoop_linux_12

输入yes后会让你输入密码:

ubtun安装hadoop ubuntu20安装hadoop_ubtun安装hadoop_13

如上图已经成功切过去了。

此时是需要密码的,每次输入密码是很不方便的,也不能实现集群的自动化,接下来需要配置ssh免密登录。

在root用户下输入ssh-keygen -t rsa 三次回车

ubtun安装hadoop ubuntu20安装hadoop_vim_14

ubtun安装hadoop ubuntu20安装hadoop_hadoop_15

ubtun安装hadoop ubuntu20安装hadoop_ubtun安装hadoop_16

@符前面是当前用户名,@后面是要登录的用户名

  • 格式化分布式文件系统HDFS

该文件系统是hadoop自动下载的的,格式化命令:hdfs namenode -format。只能格式化一次,若第一未成功需要删除上面配置的tmp目录重新格式化。

ubtun安装hadoop ubuntu20安装hadoop_xml_17

ubtun安装hadoop ubuntu20安装hadoop_vim_18

  • **启动集群start-dfs.sh**中途要输入一个yes:

ubtun安装hadoop ubuntu20安装hadoop_linux_19

  • 使用jps检查

ubtun安装hadoop ubuntu20安装hadoop_ubtun安装hadoop_20

这一步你比我少一个正常,你还没启动完。

namenode节点后台管理地址ip+端口号[50070/50090]

http://192.168.66.123:50070/

ubtun安装hadoop ubuntu20安装hadoop_linux_21

ubtun安装hadoop ubuntu20安装hadoop_xml_22

  • yarn作为集群的管理者,启动yarn的命令为:start-yarn.sh

ubtun安装hadoop ubuntu20安装hadoop_hadoop_23

也可以输入ip+[yarn端口号]进入yarn管理中心,这是在之前yarn-site.xml配置的

ubtun安装hadoop ubuntu20安装hadoop_xml_24

如图,就是成功了,伪分布安装!

ubtun安装hadoop ubuntu20安装hadoop_hadoop_25