hadoop3搭建

原创

mob64ca12dd07fb 2023-08-22 11:06:50 ©著作权

文章标签 Hadoop hadoop apache 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者mob64ca12dd07fb的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hadoop 3 搭建

介绍

Hadoop是一个开源的分布式计算框架，用于处理大规模数据集的分布式处理。它采用了分布式存储和计算的方式，能够高效地处理大规模数据。Hadoop 3是Hadoop的最新版本，引入了一些新的特性和改进。在本文中，我们将学习如何搭建Hadoop 3集群，并使用一些示例代码来演示其用法。

Hadoop 3搭建步骤

下面是在本地环境中搭建Hadoop 3集群的步骤：

步骤1：下载Hadoop 3

首先，我们需要从Hadoop官方网站下载Hadoop 3的最新版本。在下载页面上，选择适合您操作系统的二进制文件。

步骤2：设置环境变量

下载完成后，解压缩二进制文件，并将Hadoop的目录路径添加到系统的环境变量中。打开终端，并使用以下命令编辑~/.bashrc文件：

nano ~/.bashrc

在文件的末尾添加以下内容：

export HADOOP_HOME=/path/to/hadoop-3.X.X
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存并关闭文件，并运行以下命令使更改生效：

source ~/.bashrc

步骤3：配置Hadoop集群

在搭建Hadoop集群之前，我们需要对其进行一些配置。Hadoop的配置文件位于${HADOOP_HOME}/etc/hadoop/目录中。以下是一些重要的配置文件：

core-site.xml：Hadoop核心配置文件，用于指定Hadoop的核心配置参数，例如文件系统URI。
hdfs-site.xml：Hadoop分布式文件系统（HDFS）配置文件，用于指定HDFS的配置参数。
mapred-site.xml：Hadoop MapReduce配置文件，用于指定MapReduce框架的配置参数。
yarn-site.xml：Hadoop资源管理器（YARN）配置文件，用于指定YARN的配置参数。

我们可以根据需要编辑这些配置文件。以下是一个示例core-site.xml配置文件：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

步骤4：启动Hadoop集群

一旦完成配置，我们就可以启动Hadoop集群了。Hadoop提供了一个方便的脚本来启动和停止集群。在终端中运行以下命令来启动Hadoop集群：

start-dfs.sh

这将启动HDFS文件系统和YARN资源管理器。您可以使用以下命令来验证Hadoop集群的运行状态：

jps

您应该能够看到类似于以下输出的进程列表：

12345 NameNode
23456 DataNode
34567 ResourceManager
45678 NodeManager

步骤5：运行示例代码

现在，我们可以使用Hadoop集群来运行一些示例代码了。以下是一个使用Hadoop MapReduce计算Pi（π）的示例代码：

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

public class PiEstimator {

    public static class PiMapper extends Mapper<LongWritable, Text, Text, IntWritable> {

        private final static IntWritable one = new IntWritable(1);

        public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
            double x = Math.random();
            double y = Math.random();
            int result = (x * x + y * y < 1) ? 1 : 0;
            context.write(new Text("pi"), new IntWritable(result));
        }
    }

    public static class PiReducer extends Reducer<Text, IntWritable, Text, Text> {

        public