1.上传hadoop(切记在hadoop用户下)

设置hadoop classpath环境变量 如何配置hadoop环境变量_java

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_02

1.解压缩 tar -xzfhadoop-2.7.5.tar.gz

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_03

1.配置环境变量

(1)首先进入hadoop的根目录

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_04

(2)配置HADOOP_HOME

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_05

查看 bashrc文件

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_06

(3)配置HADOOP_CONF_DIR

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_07

(4)配置PATH vi ~/.bashrc (删除上面的PATH,重新写入一个新的)

exportPATH=设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_08JAVA_HOME/bin:设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_09HADOOP_HOME/sbin

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_10

vi 进入环境变量配置文件,添加上面圈选部分,:wq保存退出(PATH路径好像要在最底下,不然PATH无法使用设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_11HADOOP_HOME路径)

(5)source更新文件

(6)输入hadoop测试环境变量生效了没,证明生效

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_12

一.搭建hadoop

1.配置静态IP

(1)切换root用户(否则下面的操作没有权限)

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_13

(2)查看你的网段

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_14

(3)vi/etc/sysconfig/network-scripts/ifcfg-ens33(这里的33不是我的网段!!!)

修改BOOTPROTO=static onroot = yes

添加

IPADDR=192.168.33.110 (33设置成你的网段,最后随便设置,请牢记这个ip)

NETMASK=255.255.255.0

GATEWAY=192.168.33.2(这里的33也请改成你的网段)

DNS1=202.106.0.20

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_15

(4)重启network systemctl restart network

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_16

(5)输入 ssh 192.168.33.110,看看配置的生效了没

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_17

输入用户和密码成功登陆上了,证明整成功了

2.修改主机名和映射

(1)切换root用户,修改需要权限

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_18

(2)修改主机名 vi/etc/hostname

保存退出

(3)修改主机映射 vi /etc/hosts

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_19

保存退出

(4)重启

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_20

(5)修改window下的映射

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_21

在桌面打开这个文件(记事本),输入以下内容,记住一定输入你配置的静态ip,保存关闭

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_22

将桌面的文件拖到原来的文件夹下

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_23

选择替换

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_24

以管理员继续

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_25

完成

3.修改配置文件

(1)重新连上linux

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_26

(1)进入配置目录

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_27

(3)配置 core-site.xml

在configuration添加以下内容 然后保存退出

fs.defaultFS

hdfs://python2:9000

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_28

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_29

(1)配置hdfs-site.xml

在configuration添加以下内容 然后保存退出

dfs.replication

1

dfs.namenode.name.dir

file:///home/hadoop/opt/tmp/dfs/name

dfs.datanode.data.dir

file:///home/hadoop/opt/tmp/dfs/data

dfs.namenode.http-address

python2:50070

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_30

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_31

(5)配置mapred-site.xmll

ll查看当前目录会发现没有mapred-site.xml文件,只有一个mapred-site.xml.template的文件,我们复制一份命名为mapred-site.xml: cpmapred-site.xml.template mapred-site.xml

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_32

在configuration添加以下内容 然后保存退出

mapreduce.framework.name

yarn

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_33

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_34

(6)配置yarn-site.xml

在configuration添加以下内容 然后保存退出

yarn.resourcemanager.hostname

python2

yarn.nodemanager.aux-services

mapreduce_shuffle

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_35

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_36

(7)修改 slaves

slaves

配置datanode的主机名称

python2

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_37

1.关闭防火墙和selinux

切换到root用户

关闭防火墙

临时关闭:systemctlstop firewalld

永久关闭:systemctldisable firewalld

查看状态:systemctlstatus firewalld

关闭selinux

临时关闭:setenforce0

永久关闭:vi/etc/selinux/config

修改 SELINUX=disabled

getenforce:查看状态

切换到root用户

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_38

关闭防火墙

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_39

关闭selinux

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_40

重启机器 reboot

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_41

重新连接,登录hadoop

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_42

查看防火墙和selinux状态

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_43

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_44

5.执行hdfs文件系统格式化:hdfsnamenode -format

6.配置ssh无密码登录

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_45

输入ssh-keygen -t rsa 一直回车

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_46

ssh-copy-id 你想登录到的计算机名 输入hadoop的密码

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_47

启动服务 start-dfs.sh(如果没有配置ssh 无密码登录,那么这里会一直提示输入密码)

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_48

查看启动的服务 jps

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_49

start-yarn.sh 及jps

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_50

1.浏览器访问,输入python2:50070

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_51

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_52

成功显示!

七.文件上传

1.创建一个目录 hadoop fs-mkdir -p /user/hadoop

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_53

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_54

1.文件上传

新建一个文件

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_55

写入内容

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_56

保存退出(快捷键 esc-shift(按住)-z-z)

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_57

上传

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_58

查看

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_59

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_60

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_61

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_62

八.Anaconda的安装

1.上传

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_63

1.安装前需要安装bzip2 yum -y install bzip2

(1)需要root用户,切换用户

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_64

(2)yum -y install bzip2 安装bzip2

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_65

(3)退出root用户

设置hadoop classpath环境变量 如何配置hadoop环境变量_后端_66

3.开始安装Anaconda bash Anaconda3-5.0.1-Linux-x86_64.sh

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_67

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_68

输入yes

设置hadoop classpath环境变量 如何配置hadoop环境变量_hadoop_69

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_70

等待

设置hadoop classpath环境变量 如何配置hadoop环境变量_java_71

完成

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_72

4.更新环境变量

设置hadoop classpath环境变量 如何配置hadoop环境变量_root用户_73

5.查看jupter地址 jupyter-notebook --ip python2

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_74

6.进浏览器,输入你复制的地址

设置hadoop classpath环境变量 如何配置hadoop环境变量_xml_75