hadoop单机版配置

原创

mob649e8168b406 2024-07-30 07:27:21 ©著作权

文章标签 Hadoop bash 单机版 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者mob649e8168b406的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hadoop单机版配置指南

作为一名刚入行的开发者，配置Hadoop单机版可能会让你感到困惑。但不用担心，我将通过这篇指南，一步步教你如何完成配置。

配置流程

首先，让我们通过一个表格来了解整个配置流程：

步骤	描述
1	下载并解压Hadoop
2	配置Hadoop环境变量
3	编辑Hadoop配置文件
4	格式化Hadoop文件系统
5	启动Hadoop集群
6	验证配置

详细步骤

1. 下载并解压Hadoop

首先，你需要从Apache Hadoop官网下载Hadoop的压缩包。下载完成后，使用以下命令解压：

tar -xzvf hadoop-x.y.z.tar.gz

2. 配置Hadoop环境变量

接下来，你需要配置Hadoop的环境变量。打开你的.bashrc文件，并添加以下行：

export HADOOP_HOME=/path/to/hadoop
export PATH=$PATH:$HADOOP_HOME/bin

然后，使更改生效：

source ~/.bashrc

3. 编辑Hadoop配置文件

现在，你需要编辑Hadoop的配置文件。进入Hadoop的etc/hadoop目录，复制core-site.xml.template和hdfs-site.xml.template到core-site.xml和hdfs-site.xml，并编辑它们：

<!-- core-site.xml -->
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>

<!-- hdfs-site.xml -->
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

4. 格式化Hadoop文件系统

在启动Hadoop之前，你需要格式化Hadoop文件系统：

hdfs namenode -format

5. 启动Hadoop集群

现在，你可以启动Hadoop集群了：

start-dfs.sh
start-yarn.sh

6. 验证配置

最后，使用以下命令检查Hadoop是否正常运行：

jps

如果看到NameNode, DataNode, ResourceManager, 和 NodeManager等进程，那么恭喜你，Hadoop单机版配置成功！

旅行图

下面是Hadoop单机版配置的旅行图：

journey
  title Hadoop单机版配置流程
  section 下载并解压
    Download: 下载Hadoop压缩包
    Extract: 解压Hadoop压缩包
  section 配置环境变量
    Edit: 编辑.bashrc文件
    Source: 使更改生效
  section 编辑配置文件
    Copy: 复制模板文件
    Edit: 编辑配置文件
  section 格式化文件系统
    Format: 格式化Hadoop文件系统
  section 启动集群
    StartDFS: 启动DFS
    StartYARN: 启动YARN
  section 验证配置
    Check: 使用jps命令验证

关系图

下面是Hadoop组件之间的关系图：

erDiagram
  HDFS {
    int id
    string name
  }
  YARN {
    int id
    string name
  }
  HDFS ||--o{ NameNode : contains
  HDFS ||--o{ DataNode : contains
  YARN ||--o{ ResourceManager : contains
  YARN ||--o{ NodeManager : contains