hadoop完全分布式集群搭建

原创

睿睿睿宝子 2024-05-16 12:04:45 ©著作权

©著作权归作者所有：来自51CTO博客作者睿睿睿宝子的原创作品，请联系作者获取转载授权，否则将追究法律责任

### Hadoop完全分布式集群搭建

#### 1. 流程概述
为了搭建Hadoop的完全分布式集群，我们需要按照以下步骤进行操作：

| 步骤 | 操作 |
|---|---|
| 1 | 安装Java和SSH |
| 2 | 配置主机名和IP地址 |
| 3 | 下载和解压Hadoop |
| 4 | 配置Hadoop环境变量 |
| 5 | 配置Hadoop主从节点 |
| 6 | 启动Hadoop集群 |

#### 2. 具体操作步骤和代码示例

##### 步骤1：安装Java和SSH
首先，确保你的系统中已经安装了Java和SSH。若没有，执行以下命令进行安装：

```bash
# 安装OpenJDK
sudo apt-get update
sudo apt-get install openjdk-8-jdk

# 安装SSH
sudo apt-get install ssh
```

##### 步骤2：配置主机名和IP地址
编辑`/etc/hosts`文件，为每个节点设置主机名和IP地址，确保节点之间可以相互通信。

```bash
sudo nano /etc/hosts
# 添加主机名和IP地址，例如：
192.168.1.100 master
192.168.1.101 slave1
192.168.1.102 slave2
```

##### 步骤3：下载和解压Hadoop
从官方网站下载Hadoop压缩包，并解压到指定目录：

```bash
wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.0.tar.gz
tar -zxvf hadoop-3.3.0.tar.gz
sudo mv hadoop-3.3.0 /opt/hadoop
```

##### 步骤4：配置Hadoop环境变量
编辑`.bashrc`文件，添加Hadoop环境变量：

```bash
sudo nano ~/.bashrc
# 添加以下内容
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
```

使环境变量生效：

```bash
source ~/.bashrc
```

##### 步骤5：配置Hadoop主从节点
编辑Hadoop相关配置文件，配置主从节点信息。具体配置请参考Hadoop官方文档。

```bash
cd /opt/hadoop/etc/hadoop
sudo nano core-site.xml
```

示例`core-site.xml`配置：

```xml

fs.defaultFS
hdfs://master:9000

```

##### 步骤6：启动Hadoop集群
启动Hadoop集群的NameNode和DataNode：

```bash
hdfs namenode -format
start-dfs.sh
```

启动YARN资源管理器：

```bash
start-yarn.sh
```

至此，你已成功搭建了Hadoop的完全分布式集群！

#### 结语
通过以上步骤，你已经了解了如何搭建Hadoop的完全分布式集群。希望这篇文章对你有所帮助，如果有任何问题，欢迎随时询问！