Hadoop centos 安装单机

原创

mob64ca12cfa7d5 2023-10-08 13:21:23 ©著作权

文章标签 Hadoop Java hadoop 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者mob64ca12cfa7d5的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hadoop是一个开源的分布式系统框架，用于存储和处理大规模数据集。它能够在廉价的计算机集群上高效地运行，具有高可靠性和容错性。本文将介绍如何在CentOS系统上安装单机版的Hadoop，并提供相应的代码示例。

安装Java

在安装Hadoop之前，需要先安装Java开发环境。CentOS上可以使用yum命令来安装Java。

sudo yum update
sudo yum install java-1.8.0-openjdk-devel

安装完成后，可以通过以下命令验证Java是否安装成功。

java -version

下载和解压Hadoop

可以从Hadoop官方网站下载最新的稳定版本的Hadoop。在本文中，我们使用Hadoop 2.10.1版本为例。

wget 
tar -xzvf hadoop-2.10.1.tar.gz

配置环境变量

编辑~/.bashrc文件，添加以下内容。

export HADOOP_HOME=/path/to/hadoop-2.10.1
export PATH=$PATH:$HADOOP_HOME/bin

使环境变量生效。

source ~/.bashrc

配置Hadoop

进入Hadoop的安装目录，编辑etc/hadoop/hadoop-env.sh文件，设置Java的安装路径。

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

接下来，编辑etc/hadoop/core-site.xml文件，配置Hadoop的核心参数。

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>

然后，编辑etc/hadoop/hdfs-site.xml文件，配置Hadoop分布式文件系统的参数。

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

格式化Hadoop文件系统

在使用Hadoop之前，需要先格式化Hadoop文件系统。

hdfs namenode -format

启动Hadoop

使用以下命令启动Hadoop。

start-all.sh

验证Hadoop安装

可以通过以下命令来验证Hadoop的安装情况。

jps

如果安装成功，会看到类似以下输出。

NameNode
ResourceManager
DataNode
NodeManager

此时，可以通过浏览器访问http://localhost:50070来查看Hadoop的Web界面。

关闭Hadoop

使用以下命令关闭Hadoop。

stop-all.sh

至此，我们已经成功安装和配置了Hadoop单机版。

总结

本文介绍了在CentOS系统上安装单机版的Hadoop的步骤。首先，我们安装了Java开发环境。然后，我们下载和解压了Hadoop。接下来，我们配置了环境变量和Hadoop的相关配置文件。最后，我们格式化了Hadoop文件系统，并启动了Hadoop。通过本文的步骤，您可以在CentOS上轻松地安装和配置Hadoop，以便进行大规模数据的存储和处理。

pie
    "HDFS" : 70
    "MapReduce" : 30

erDiagram
    Customer ||--o{ Order : has
    Customer {
        int id
        string name
        string email
    }
    Order {
        int id
        int customerId
        string product
    }