utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件

转载

mob64ca140e76c8 2024-06-18 14:32:54

文章标签 utm虚拟机镜像文件下载 hadoop 分布式大数据 Hadoop 文章分类 云原生云计算

Hadoop简介与完全分布式集群的搭建（详版）

Hadoop简介：

1．Hadoop是什么：

2．Hadoop解决什么：

3．Hadoop 生态圈：

4．Hadoop 1.x,2.x,3.x组成：

Hadoop组件介绍

Yarn ：另一种资源协调者，Hadoop的资源管理器

MapReduce：分为map,reduce两个阶段

Yarn，Mapreduce，HDFS之间的关系：

HDFS组件：万一Name Node挂了，2NN作为秘书也可以知道数据存储在什么位置

Hadoop组件之间的工作关系：

搭建分布式集群

2.Centos安装

3.配置IP地址

5JDK，Hadoop3.1.3安装

6.rsync指令

9. 群起集群

10. 配置历史服务器

11. 配置日志的聚集

12. 集群启动/停止方式总结

13. 编写Hadoop集群常用脚本

14. 常用端口号说明

15. 集群时间同步

16.常见错误及解决方案

Hadoop简介与完全分布式集群的搭建（详版）

Hadoop简介：

1．Hadoop是什么：

是由apache基金会所开发的分布式系统基础架构。

2．Hadoop解决什么：

解决海量数据的存储和海量数据的分析计算问题

3．Hadoop 生态圈：

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据

4．Hadoop 1.x,2.x,3.x组成：

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_02

Hadoop组件介绍

Yarn ：另一种资源协调者，Hadoop的资源管理器

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_03

MapReduce：分为map,reduce两个阶段

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_04

Yarn，Mapreduce，HDFS之间的关系：

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_05

HDFS组件：万一Name Node挂了，2NN作为秘书也可以知道数据存储在什么位置

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_06

1.Name Node（NN）：存储文件元数据，如文件，文件目录结构，文件属性（生成时间，副本数，文件权限）以及每个文件的块列表

2.DataNode（dn）:在本地文件系统存储文件块数据，以及块数据的校验和。

3.secondary (2NN):每隔一段时间对Name Node元数据备份。

Hadoop组件之间的工作关系：

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_07

搭建分布式集群

VMware的安装：

下载网址：下载 VMware Workstation Pro | CN

点击立即下载

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_08

安装前先关闭电脑管家等杀毒软件，避免配置写不进注册表，导致安装失败；
找到下载好的VMware-workstation-full-16.1.1-17801498.exe文件，鼠标右击以管理员身份运行
先勾选我接受许可协议中的条款，然后点击下一步
选择软件安装路径，默认安装在C盘，点击更改可修改安装路径，注意：安装路径文件夹名称均不能含有中文字符！这里我将软件安装在D盘文件夹下，然后点击下一步
用户体验设置取消勾选，点击下一步
无脑下一步
开始安装
等待
点击许可证
可以选择输入密钥，或者跳过进行试用30天，密钥可以在网上搜索，
以下可以试试

ZF3R0-FHED2-M80TY-8QYGC-NPKYF
YF390-0HF8P-M81RQ-2DXQE-M2UT6
ZF71R-DMX85-08DQY-8YMNC-PPHV8

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_09

13.完成

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_10

2.Centos安装

1.新建虚拟机

硬件安装，打开VMware，点击创建虚拟机
选择自定义安装，自定义更高级，可以根据用户喜好自定义功能
直接下一步
先不安装操作系统，先把硬件配好
选择Linux操作系统，centos7,64位的，下一步
更改虚拟机名称和位置
打开资源管理器，查看cpu内核总数，将来克隆3台虚拟机，加上Windows的不能超过总的内核数目
根据上面数的cpu核数。处理器固定为2，如果你的是16核的计算机，则每个处理器核数为2，8核的计算机每个处理器配核数1.
内存配置4个G
网络配置
使用默认推荐
创建虚拟磁盘
指定虚拟磁盘为50G，并不是把计算机磁盘的50G固定划分给了虚拟机，而是虚拟机磁盘容量上限50G，如果只用了10G，剩下的Windows操作系统一样可以用
将磁盘文件放到之前命名的Hadoop100中
虚拟机硬件配置完成

2．安装系统（centos7）

1.安装系统之前检查自己虚拟机的BIOS的虚拟化是否打开

（1）win10:

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_11

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_12

（2）win7系统要进入BIOS模式查看

如果没有开启虚拟化就安装会报错：

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_13

如果BIOS虚拟化没有开启，重启电脑，在加载界面时按f1-f10,，具体怎么进入得根据自己的型号查一下。

以下提供两个作者大大的链接：^v5^pc_search_result_control_group,157^v4^control&utm_term=cpu%E8%99%9A%E6%8B%9F%E5%8C%96%E6%80%8E%E4%B9%88%E5%BC%80%E5%90%AF&spm=1018.2226.3001.4187

^v5^pc_search_result_control_group,157^v4^control&utm_term=bios%E5%BC%80%E5%90%AF%E8%99%9A%E6%8B%9F%E5%8C%96&spm=1018.2226.3001.4187

仅供参考

开启虚拟化后，下载镜像文件。下载链接：centos-7-isos-x86_64安装包下载_开源镜像站-阿里云

镜像文件说明

CentOS-7-x86_64-DVD-1708.iso 标准安装版（推荐）

CentOS-7-x86_64-Everything-1708.iso

完整版，集成所有软件（以用来补充系统的软件或者填充本地镜像）

CentOS-7-x86_64-LiveGNOME-1708.iso GNOME桌面版

CentOS-7-x86_64-LiveKDE-1708.iso KDE桌面版

CentOS-7-x86_64-Minimal-1708.iso 精简版，自带的软件最少

CentOS-7-x86_64-NetInstall-1708.iso 网络安装版（从网络安装或者救援系统）

我们下载标准版

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_14

点击CD/DVD（IDE）光盘

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_15

选择刚刚下载的光盘文件
相当于系统盘以及插入了，直接启动
单机进去
开始安装，需要一点时间
成功后跳转到语言选择页面
下一步选择日期和时间

软件选择安装，我们新手选择GNOME桌面（他有图形化页面，方便查看学习，但是我们也是用命令行操作），如果是大佬就可以直接选择最小安装，用命令行操作。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_16

配置磁盘分区，我们选择自己分配（如果不想自己分配，选择他的默认自动分配也行）

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_17

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_18

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_19

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_20

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_21

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_22

配置kdump,系统软件奔溃时候，崩溃前夕可以备份一部分出去，kudmp就会开辟一部分内存来存储这个备份数据，我们学习阶段节省资源就关闭他，崩溃就崩溃，如果有需要开发可以选择开启kdump。
配置网络和主机名称，后期会说怎么用命令行配置
Security policy保持默认打开就行
开始安装，设置root密码，学习阶段设置简单一点，方便日后频繁输入，开发阶段可以复杂一点
等待安装一段时间
重启

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_23

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_24

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_25

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_26

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_27

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_28

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_29

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_30

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_31

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_32

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_33

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_34

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_35

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_36

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_37

安装完成

3.配置IP地址

1配置VMware的IP地址

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_38

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_39

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_40

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_41

配置WindowsIP地址
打开网络设置，点击网络适配器

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_42

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_43

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_44

最后确定关闭就行了

3.配置虚拟机的IP地址

1.打开终端

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_45

2.切换root用户操作

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_46

3.输入vim /etc/sysconfig/network-scripts/ifcfg-ens33 进入

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_47

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_48

4.对里面的东西进行更改

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_49

添加内容为：

IPADDR=192.168.10.100

GATEWAY=192.168.10.2

DNS1=192.168.10.2

更改之后

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_50

输入更改完成之后，按Esc键，然后输入:wq（冒号要输入，如果文件是只读，可以输入：wq!强制保存退出）保存退出

5.配置虚机名称

进入命令：vim /etc/hostname

是hadoop100就行

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_51

6.然后配置虚机名称映射，作用是用一个名称来代替192.168.10.100，因为如果没有映射，很多程序里面存储了这个IP地址，以后一旦更改IP地址，这些程序都要一个一个找出来更改，很麻烦，只需要用一个映射来代替IP地址用在程序里面即可，IP地址更改，映射照常对应IP地址，程序照常运行。

输入命令：vim /etc/hosts 进入

添加内容：（因为后期最多可能用到8台服务器）

192.168.10.100 hadoop100

192.168.10.101 hadoop101

192.168.10.102 hadoop102

192.168.10.103 hadoop103

192.168.10.104 hadoop104

192.168.10.105 hadoop105

192.168.10.106 hadoop106

192.168.10.107 hadoop107

192.168.10.108 hadoop108

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_52

然后按Esc ,输入:wq保存退出

7.重启，结束之后输入：reboot后回车重启。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_53

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_54

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_55

进入之后和之前的操作一样，前进就行，然后打开命令终端，验证我们的IP地址。输入 ifconfig

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_56

再ping一下外网看看能不能ping通

输入 ping www.baidu.com

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_57

输入hostname查看主机名称，是hadoop100就圆满成功

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_58

远程操作服务器
使用xshell,或者mobaxterm
下载使用mobaxterm

推荐这位博主的mobaxterm博客下载安装 ^v5^pc_search_result_control_group,157^v4^control&utm_term=mobaxterm%E4%B8%8B%E8%BD%BD&spm=1018.2226.3004187
打开mobaxterm 连接hadoop100，用havtl账户登入

输入账号（使用havtl）和密码

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_59

保存密码

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_60

成功连接

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_61

设置主机映射

1.在Windows系统下找到C:\Windows\System32\drivers\etc下的host文件，添加：

192.168.10.100 hadoop100

192.168.10.101 hadoop101

192.168.10.102 hadoop102

192.168.10.103 hadoop103

192.168.10.104 hadoop104

192.168.10.105 hadoop105

192.168.10.106 hadoop106

192.168.10.107 hadoop107

192.168.10.108 hadoop108

如果是win7系统，可以直接记事本打开编辑，保存即可，win10有的会出现权限不够的情况，就可以把这个文件复制到桌面，然后更改完成再移动到C:\Windows\System32\drivers\etc 替换hosts。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_62

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_63

模板虚拟机以及克隆
配置模板虚拟机环境
切换root用户，输入su root,输入密码。Cd切换根目录然后ping www.baidu.com。测试能不能上网，接下来要用yum下载一个软件仓库epel-release。输入 yum install -y epel-release。下载即可。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_64

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_65

注意如果Linux安装的是最小系统版，还需要安装下面的根据，如果是桌面版的则不需要执行以下操作

net-tool ：工具包集合，包含ifconfig等命令

yum install -y net-tools

vim：编辑器

yum install -y vim

关闭防火墙，关闭防火墙开机自启

1：systemctl stop firewalld

2：systemctl disable firewalld.service

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_66

我们给havtl用户赋予root权限，方便日后加sudo执行root权限的命令

输入命令：vim /etc/sudoers ,修改/etc/sudoers文件，在%wheel这行下面加一行，完成之后:wq!保存退出

注意: atguigu这一行不要直接放到root行下面，因为所有用户都属于wheel组，你先配置了atguigu具有免密功能，但是程序执行到%wheel行时，该功能又被覆盖回需要密码。所以 atguigu要放到%wheel这行下面。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_67

然后按照以下命令测试：

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_68

5. 卸载虚拟机自带的JDK

注意:如果你的虚拟机是最小化安装不需要执行这一步。

切换root用户删除

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

rpm -ga:查询所安装的所有rpm软件包
grep -i: 忽略大小写
xargs -nl:表示每次只传递一个参数
rpm -e -nodeps :强制卸载软件
重启虚拟机

[ root@hadoop100~]# reboot

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_69

克隆3台虚拟机

克隆出hadoop102,hadoop103,hadoop104,更改IP地址和主机名称。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_70

关闭虚机

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_71

克隆虚机

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_72

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_73

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_74

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_75

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_76

然后 hadoop103，104，也按照这样的方法克隆。

学会移除和删除虚机
移除，只会在VMware界面删除，在磁盘文件还在，彻底删除需要右击Hadoop100，选择管理，从磁盘移除。
更改克隆虚机的IP地址和主机名称
启动Hadoop102，
进去桌面之后，右击桌面，打开终端，修改IP地址，和hadoop100改IP地址一样

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_77

输入：vim /etc/sysconfig/network-scripts/ifcfg-ens33 ，把IP改称102.

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_78

再输入：vim /etc/hostname，更改主机名称
然后reboot，重启虚机，查看IP地址，主机名称有没有正确改正，再ping一下外网看有没有用。
接下来hadoop103,104,也按照上面流程更改IP地址和主机名称
然后再按照之前的方法在mobaxterm上面配置好hadooop102,103,104的远程连接

5JDK，Hadoop3.1.3安装

在hadoop102上安装jdk
先将jdk8和Hadoop的jar包上传到Hadoop102，再从102拷贝到103，104.

链接：https://pan.baidu.com/s/1OLuj6yuCNqgQXigkH6EsTQ?pwd=havt

提取码：havt

在里面有一些用到的资料，jdk8和hadoop313在jar包文件夹里面。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_79

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_80

2.然后输入：tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/ 。把jdk解压安装在module文件夹。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_81

3.配置jdk环境变量

输入：cd /etc/profile.d/。里面的sh文件，在机器启动的时候都会加载一下。我们自己创建一个自己的环境变量文件my_env.sh。在命令里面输入：sudo vim my_env.sh。

在文件里面输入：

#JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_212

export PATH=$PATH:$JAVA_HOME/bin

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_82

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_83

然后再输入：source /etc/profile.加载一下profile文件。然后再输入：java。就能显示配置好了

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_84

在hadoop102上安装hadoop
将hadoop313解压到module文件夹中。

指令：tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_85

配置环境变量。

输入指令：sudo vim /etc/profile.d/my_env.sh。配置环境变量。在里面添加：

#HADOOP_HOME

export HADOOP_HOME=/opt/module/hadoop-3.1.3

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADDOP_HOME/sbin

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_86

返回来继续source一下。输入命令：source /etc/profile.加载一下profile文件。然后输入hadoop,就会显示出来。说明配置成功。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_87

将jdk和hadoop拷贝到hadoop103和104

scp命令拷贝全部内容

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_88

方法一：从102拷贝推送到103

使用scp安全拷贝。输入：cd /opt/module。进入module文件夹。
输入：scp -r jdk1.8.0_212/ havtl@hadoop103:/opt/module/

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_89

方法二：103从102中拉取

1.也是使用scp命令。先进入到103的module文件夹下。

2.输入：scp -r havtl@hadoop102:/opt/module/hadoop-3.1.3 ./

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_90

方法三：

用hadoop103,scp命令将hadoop102的jdk和hadoop拷贝到hadoop104。

在103中输入：scp -r havtl@hadoop102:/opt/module/* havtl@hadoop104:/opt/module

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_91

这样就将hadoop102的jdk和hadoop都拷贝到了104。

6.rsync指令

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_92

rsync拷贝差异性文件内容，不整个拷贝复制过去，效率比scp高。

xsync集群分发脚本

创建一个脚本，使“xsync+文件名“指令在全局任何路径都可以使用，将改文件同步到集群的各个节点（把脚本放在声明了全局环境变量的路径）输入：echo $PATH。可以看见全局变量路径有哪些。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_93

然后再在bin目录下创建一个xsync脚本，输入：vim xsync。按i进入编辑

在里面添加脚本内容：(空格符号和换行符号要检查下有没有错误)

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
    echo Not Enough Arguement!
    exit;
fi
#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
do
    echo ====================  $host  ====================
    #3. 遍历所有目录，挨个发送
    for file in $@
    do
        #4. 判断文件是否存在
        if [ -e $file ]
            then
                #5. 获取父目录
                pdir=$(cd -P $(dirname $file); pwd)
                #6. 获取当前文件的名称
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!
        fi
    done
done

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_94

然后更改xsync的权限，输入chmod 777 xsync。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_95

然后测试改脚本能不能用，将102中的havtl/home/bin目录分发到103，104.

输入：xsync /home/havtl/bin/。然后输入密码就可以完成。查看103，104是否有bin文件和xsync脚本。

然后现在将hadoop102的环境变量分发到103，104。

输入：xsync /etc/profile.d/my_env.sh。会出现权限不足，所以加sudo,但是root用户用不了在home/havtl目录下的脚本，所以要再用的时候加一个绝对路径或相对路径。

则输入：sudo /home/havtl/bin/xsync /etc/profile.d/my_env.sh。然后成功分发

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_96

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_97

最后要在103，104 里面resource一下my_env.sh。

输入：source /etc/profile

加载完成

ssh免密登入
原理图
生成公钥和私钥

[havtl@hadoop102 .ssh]$ ssh-keygen -t rsa

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_98

然后敲（三个回车），就会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_99

将公钥拷贝到要免密登录的目标机器上：

[havtl@hadoop102 .ssh]$ ssh-copy-id hadoop103
[havtl@hadoop102 .ssh]$ ssh-copy-id hadoop104
[havtl@hadoop102 .ssh]$ ssh-copy-id hadoop102（也要对自己进行配置）

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_100

注意：

还需要在hadoop103上采用 havtl账号配置一下无密登录到hadoop102、hadoop103、hadoop104服务器上。

还需要在hadoop104上采用havtl账号配置一下无密登录到hadoop102、hadoop103、hadoop104服务器上。

root 账号也要按上面的方法每个机器配置免密登录（su root 切换root用户）；

4. .ssh文件夹下（~/.ssh）的文件功能解释

known_hosts	记录ssh访问过计算机的公钥（public key）
id_rsa	生成的私钥
id_rsa.pub	生成的公钥
authorized_keys	存放授权过的无密登录服务器公钥

集群配置规划

1. 集群部署规划

注意：

NameNode和SecondaryNameNode不要安装在同一台服务器
ResourceManager也很消耗内存，不要和NameNode、SecondaryNameNode配置在同一台机器上。

	hadoop102	hadoop103	hadoop104

HDFS	NameNode DataNode	DataNode	SecondaryNameNode DataNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager

Hadoop配置文件分两类：默认配置文件和自定义配置文件，只有用户想修改某一默认配置值时，才需要修改自定义配置文件，更改相应属性值。

（1）默认配置文件：

要获取的默认文件	文件存放在Hadoop的jar包中的位置

[core-default.xml]	hadoop-common-3.1.3.jar/core-default.xml
[hdfs-default.xml]	hadoop-hdfs-3.1.3.jar/hdfs-default.xml
[yarn-default.xml]	hadoop-yarn-common-3.1.3.jar/yarn-default.xml
[mapred-default.xml]	hadoop-mapreduce-client-core-3.1.3.jar/mapred-default.xml

（2）自定义配置文件：

core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml四个配置文件存放在$HADOOP_HOME/etc/hadoop这个路径上，用户可以根据项目需求重新进行修改配置。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_101

在这里提供了默认配置文件：百度网盘请输入提取码

解压后，默认配置文件在这里面，可以查看源码怎么写的。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_102

3）配置集群

（1）核心配置文件

配置core-site.xml

[atguigu@hadoop102 ~]$ cd $HADOOP_HOME/etc/hadoop

[atguigu@hadoop102 hadoop]$ vim core-site.xml

文件内容如下：

<?xml versinotallow="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:8020</value>
    </property>
    <!-- 指定hadoop数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
    </property>
    <!-- 配置HDFS网页登录使用的静态用户为havtl -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>havtl</value>
    </property>
</configuration>

（2）HDFS配置文件

配置hdfs-site.xml

[atguigu@hadoop102 hadoop]$ vim hdfs-site.xml

文件内容如下：

<?xml versinotallow="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
   <!-- nn web端访问地址-->
   <property>
        <name>dfs.namenode.http-address</name>
        <value>hadoop102:9870</value>
    </property>
   <!-- 2nn web端访问地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop104:9868</value>
    </property>
</configuration>

（3）YARN配置文件

配置yarn-site.xml

[atguigu@hadoop102 hadoop]$ vim yarn-site.xml

文件内容如下：

<?xml versinotallow="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- 指定MR走shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!-- 指定ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop103</value>
    </property>
    <!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
</configuration>

（4）MapReduce配置文件

配置mapred-site.xml

[atguigu@hadoop102 hadoop]$ vim mapred-site.xml

文件内容如下：

<?xml versinotallow="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
   <!-- 指定MapReduce程序运行在Yarn上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

4）hadoop102配置好了文件，在集群上分发配置好的Hadoop配置文件

[atguigu@hadoop102 hadoop]$ xsync /opt/module/hadoop-3.1.3/etc/hadoop/

5）去103和104上查看文件分发情况

[atguigu@hadoop103 ~]$ cat /opt/module/hadoop-3.1.3/etc/hadoop/core-site.xml
[atguigu@hadoop104 ~]$ cat /opt/module/hadoop-3.1.3/etc/hadoop/core-site.xml

9. 群起集群

1配置workers

[atguigu@hadoop102 hadoop]$ vim /opt/module/hadoop-3.1.3/etc/hadoop/workers

在该文件中增加如下内容：(添加工作节点机器，把自带的localhost删掉)

hadoop102

hadoop103

hadoop104

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_103

注意：该文件中添加的内容结尾不允许有空格，文件中不允许有空行。

然后同步所有节点配置文件

[atguigu@hadoop102 hadoop]$xsync /opt/module/hadoop-3.1.3/etc

2.启动集群

（1）如果集群是第一次启动，需要在hadoop102节点格式化NameNode（注意：格式化NameNode，会产生新的集群id，导致NameNode和DataNode的集群id不一致，集群找不到已往数据。如果集群在运行过程中报错，需要重新格式化NameNode的话，一定要先停止namenode和datanode进程，并且要删除所有机器的data和logs目录，然后再进行格式化。）

[atguigu@hadoop102 hadoop-3.1.3]$ hdfs namenode -format

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_104

成功之后会多一个data,logs目录

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_105

（2）启动HDFS

在hadoop-3.1.3里面的sbin目录里面有一些脚本命令

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_106

[atguigu@hadoop102 hadoop-3.1.3]$ sbin/start-dfs.sh

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_107

查看103，104的datanode和secondary namenode

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_108

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_109

启动之后在自己的电脑浏览器里面输入192.168.10.102:9870或者hadoop102:9870可以查看

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_110

（3）在配置了ResourceManager的节点（hadoop103）启动YARN

一定要在103上启动yarn，

[atguigu@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_111

查看102，104的nodemanager已经启动

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_112

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_113

（4）Web端查看HDFS的NameNode

（a）浏览器中输入：http://hadoop102:9870或者192.168.10.102:9870

（b）查看HDFS上存储的数据信息

（5）Web端查看YARN的ResourceManager

（a）浏览器中输入：http://hadoop103:8088或者192.168.10.103:8088

（b）查看YARN上运行的Job信息

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_114

注意：每个配置在哪个节点一定要记清楚，启动在哪里启动，

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_115

3）集群基本测试(前面没做在hadoop-3.1.3创建wcinput,wcoupt 就不用测试一下，这里只是学习一些操作，能看懂会用就行 )

（1）上传文件到集群

上传小文件（在102先创建一个文件夹wcinput）

[atguigu@hadoop102 ~]$ hadoop fs -mkdir /wcinput

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_116

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_117

[atguigu@hadoop102 ~]$ hadoop fs -put $HADOOP_HOME/wcinput/word.txt /input

上传大文件

[atguigu@hadoop102 ~]$ hadoop fs -put /opt/software/jdk-8u212-linux-x64.tar.gz /

（2）上传文件后查看文件存放在什么位置

查看HDFS文件存储路径

[atguigu@hadoop102 subdir0]$ pwd

/opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1436128598-192.168.10.102-1610603650062/current/finalized/subdir0/subdir0

查看HDFS在磁盘存储文件内容

[atguigu@hadoop102 subdir0]$ cat blk_1073741825

hadoop yarn

hadoop mapreduce

atguigu

（3）拼接

-rw-rw-r--. 1 atguigu atguigu 134217728 5月  23 16:01 blk_1073741836
-rw-rw-r--. 1 atguigu atguigu   1048583 5月  23 16:01 blk_1073741836_1012.meta
-rw-rw-r--. 1 atguigu atguigu  63439959 5月  23 16:01 blk_1073741837
-rw-rw-r--. 1 atguigu atguigu    495635 5月  23 16:01 blk_1073741837_1013.meta
[atguigu@hadoop102 subdir0]$ cat blk_1073741836>>tmp.tar.gz
[atguigu@hadoop102 subdir0]$ cat blk_1073741837>>tmp.tar.gz
[atguigu@hadoop102 subdir0]$ tar -zxvf tmp.tar.gz

（4）下载

[atguigu@hadoop104 software]$ hadoop fs -get /jdk-8u212-linux-x64.tar.gz ./

（5）执行wordcount程序

[atguigu@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output

10. 配置历史服务器

1. 为了查看程序的历史运行情况，需要配置一下历史服务器。具体配置步骤如下：

1）配置mapred-site.xml

[atguigu@hadoop102 hadoop]$ vim mapred-site.xml

在该文件里面增加如下配置。

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>
<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_118

2）分发配置

[atguigu@hadoop102 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml

3）在hadoop102启动历史服务器

[atguigu@hadoop102 hadoop]$ mapred --daemon start historyserver

4）查看历史服务器是否启动

[atguigu@hadoop102 hadoop]$ jps

5）查看JobHistory

http://hadoop102:19888/jobhistory

11. 配置日志的聚集

日志聚集概念：应用运行完成以后，将程序运行日志信息上传到HDFS系统上。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_大数据_119

日志聚集功能好处：可以方便的查看到程序运行详情，方便开发调试。

注意：开启日志聚集功能，需要重新启动NodeManager 、ResourceManager和HistoryServer。

开启日志聚集功能具体步骤如下：

1）配置yarn-site.xml

[atguigu@hadoop102 hadoop]$ vim yarn-site.xml

在该文件里面增加如下配置。

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

2）分发配置

[atguigu@hadoop102 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/yarn-site.xml

3）关闭NodeManager 、ResourceManager和HistoryServer

[atguigu@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
[atguigu@hadoop103 hadoop-3.1.3]$ mapred --daemon stop historyserver

4）启动NodeManager 、ResourceManage和HistoryServer

[atguigu@hadoop103 ~]$ start-yarn.sh
[atguigu@hadoop102 ~]$ mapred --daemon start historyserver

5）删除HDFS上已经存在的输出文件

[atguigu@hadoop102 ~]$ hadoop fs -rm -r /output

6）执行WordCount程序

[atguigu@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output

7）查看日志

（1）历史服务器地址

http://hadoop102:19888/jobhistory

（2）历史任务列表

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_120

（3）查看任务运行日志

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_121

（4）运行日志详情

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_utm虚拟机镜像文件下载_122

12. 集群启动/停止方式总结

1）各个模块分开启动/停止（配置ssh是前提）常用

（1）整体启动/停止HDFS

start-dfs.sh/stop-dfs.sh

（2）整体启动/停止YARN

start-yarn.sh/stop-yarn.sh

2）各个服务组件逐一启动/停止

（1）分别启动/停止HDFS组件

hdfs --daemon start/stop namenode/datanode/secondarynamenode

（2）启动/停止YARN

yarn --daemon start/stop resourcemanager/nodemanager

13. 编写Hadoop集群常用脚本

1）Hadoop集群启停脚本（包含HDFS，Yarn，Historyserver）：myhadoop.sh

[atguigu@hadoop102 ~]$ cd /home/atguigu/bin
[atguigu@hadoop102 bin]$ vim myhadoop.sh
• 输入如下内容
#!/bin/bash
if [ $# -lt 1 ]
then
    echo "No Args Input..."
    exit ;
fi
case $1 in
"start")
        echo " =================== 启动 hadoop集群 ==================="
        echo " --------------- 启动 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/sbin/start-dfs.sh"
        echo " --------------- 启动 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop-3.1.3/sbin/start-yarn.sh"
        echo " --------------- 启动 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/bin/mapred --daemon start historyserver"
;;
"stop")
        echo " =================== 关闭 hadoop集群 ==================="
        echo " --------------- 关闭 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/bin/mapred --daemon stop historyserver"
        echo " --------------- 关闭 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop-3.1.3/sbin/stop-yarn.sh"
        echo " --------------- 关闭 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/sbin/stop-dfs.sh"
;;
*)
    echo "Input Args Error..."
;;

esac

保存后退出，然后赋予脚本执行权限

[atguigu@hadoop102 bin]$ chmod 777 myhadoop.sh

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_123

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_124

2）查看三台服务器Java进程脚本：jpsall

[atguigu@hadoop102 ~]$ cd /home/atguigu/bin

[atguigu@hadoop102 bin]$ vim jpsall

输入如下内容

#!/bin/bash

for host in hadoop102 hadoop103 hadoop104

echo =============== $host ===============

ssh $host jps

done

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_分布式_125

保存后退出，然后赋予脚本执行权限

[atguigu@hadoop102 bin]$ chmod 777 jpsall

3）分发/home/atguigu/bin目录，保证自定义脚本在三台机器上都可以使用

[atguigu@hadoop102 ~]$ xsync /home/atguigu/bin/

14. 常用端口号说明

端口名称	Hadoop2.x	Hadoop3.x

NameNode内部通信端口	8020 / 9000	8020 / 9000/9820
NameNode HTTP UI	50070	9870
Yarn//MapReduce查看执行任务端口	8088	8088
历史服务器通信端口	19888	19888

二、常用的配置文件

3.x core-site. xml hdfs-site. xml yarn-site. xml mapred-site. xml workers

2.x core-site. xml hdfs-site. xml yarn-site. xml mapred-site. xml slaves

15. 集群时间同步

如果服务器在公网环境（能连接外网），可以不采用集群时间同步，因为服务器会定期和公网时间进行校准；

如果服务器在内网环境，必须要配置集群时间同步，否则时间久了，会产生时间偏差，导致集群执行任务时间不同步。

1）需求

找一个机器，作为时间服务器，所有的机器与这台集群时间进行定时的同步，生产环境根据任务对时间的准确程度要求周期同步。测试环境为了尽快看到效果，采用1分钟同步一次。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_Hadoop_126

2）时间服务器配置（必须root用户）

（

1）查看所有节点ntpd服务状态和开机自启动状态
[atguigu@hadoop102 ~]$ sudo systemctl status ntpd
[atguigu@hadoop102 ~]$ sudo systemctl start ntpd
[atguigu@hadoop102 ~]$ sudo systemctl is-enabled ntpd
（2）修改hadoop102的ntp.conf配置文件
[atguigu@hadoop102 ~]$ sudo vim /etc/ntp.conf

修改内容如下

（a）修改1（授权192.168.10.0-192.168.10.255网段上的所有机器可以从这台机器上查询和同步时间）
#restrict 192.168.10.0 mask 255.255.255.0 nomodify notrap
为restrict 192.168.10.0 mask 255.255.255.0 nomodify notrap
       （b）修改2（集群在局域网中，不使用其他互联网上的时间）
server 0.centos.pool.ntp.org iburst
server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst
为
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst

（c）添加3（当该节点丢失网络连接，依然可以采用本地时间作为时间服务器为集群中的其他节点提供时间同步）

server 127.127.1.0

fudge 127.127.1.0 stratum 10

（3）修改hadoop102的/etc/sysconfig/ntpd 文件

[atguigu@hadoop102 ~]$ sudo vim /etc/sysconfig/ntpd

增加内容如下（让硬件时间与系统时间一起同步）

SYNC_HWCLOCK=yes

（4）重新启动ntpd服务

[atguigu@hadoop102 ~]$ sudo systemctl start ntpd

（5）设置ntpd服务开机启动

[atguigu@hadoop102 ~]$ sudo systemctl enable ntpd

3）其他机器配置（必须root用户）

（1）关闭所有节点上ntp服务和自启动

[atguigu@hadoop103 ~]$ sudo systemctl stop ntpd
[atguigu@hadoop103 ~]$ sudo systemctl disable ntpd
[atguigu@hadoop104 ~]$ sudo systemctl stop ntpd
[atguigu@hadoop104 ~]$ sudo systemctl disable ntpd

（2）在其他机器配置1分钟与时间服务器同步一次

[atguigu@hadoop103 ~]$ sudo crontab -e

编写定时任务如下：

*/1 * * * * /usr/sbin/ntpdate hadoop102

（3）修改任意机器时间

[atguigu@hadoop103 ~]$ sudo date -s "2021-9-11 11:11:11"

（4）1分钟后查看机器是否与时间服务器同步

[atguigu@hadoop103 ~]$ sudo date

16.常见错误及解决方案

1）防火墙没关闭、或者没有启动YARN

INFO client.RMProxy: Connecting to ResourceManager at hadoop108/192.168.10.108:8032

2）主机名称配置错误

3）IP地址配置错误

4）ssh没有配置好

5）root用户和atguigu两个用户启动集群不统一

6）配置文件修改不细心

7）不识别主机名称

java.net.UnknownHostException: hadoop102: hadoop102
        at java.net.InetAddress.getLocalHost(InetAddress.java:1475)
        at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:146)
        at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1290)
        at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1287)
        at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)

解决办法：

（1）在/etc/hosts文件中添加192.168.10.102 hadoop102

（2）主机名称不要起hadoop hadoop000等特殊名称

8）DataNode和NameNode进程同时只能工作一个。

utm虚拟机镜像文件下载 utm虚拟机windows 10镜像文件_hadoop_127

9）执行命令不生效，粘贴Word中命令时，遇到-和长–没区分开。导致命令失效

解决办法：尽量不要粘贴Word中代码。

10）jps发现进程已经没有，但是重新启动集群，提示进程已经开启。

原因是在Linux的根目录下/tmp目录中存在启动的进程临时文件，将集群相关进程删除掉，再重新启动集群。

11）jps不生效

原因：全局变量hadoop java没有生效。解决办法：需要source /etc/profile文件。

12）8088端口连接不上

[atguigu@hadoop102 桌面]$ cat /etc/hosts
注释掉如下代码
#127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
#::1         hadoop102

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：mysql 查询时间过滤 mysql查询时间范围优化

下一篇：中科方德编译安装docker 中科方德用户手册

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯