单机上部署Hadoop2.2.0

精选转载

rickcheung 2014-01-22 10:00:25

文章标签 Hadoop MapReduce 文章分类 Hadoop 大数据

首先安装JDK

1下载JDK-下载jkd（http://www.oracle.com/technetwork/java/javase/downloads/index.html）

2对于32位的系统可以下载以下两个Linux x86版本, 64位系统下载Linux x64版本(即x64.rpm和x64.tar.gz)（uname -a 查看系统版本 or getconfig LONG_BIT）

3安装JDK

安装方法参考http://docs.oracle.com/javase/7/docs/webnotes/install/linux/linux-jdk.html

a 选择要安装java的位置，如/usr/目录下，新建文件夹java(mkdirjava)

b 将文件jdk-7u40-linux-i586.tar.gz移动到/usr/java

c 解压：tar -zxvf jdk-7u40-linux-i586.tar.gz

v 删除jdk-7u40-linux-i586.tar.gz（为了节省空间）

至此，jkd安装完毕，下面配置环境变量

4打开/etc/profile（vim /etc/profile）

在最后面添加如下内容：

JAVA_HOME=/usr/java/jdk1.7.0_40（这里的版本号1.7.40要根据具体下载情况修改）

CLASSPATH=.:$JAVA_HOME/lib.tools.jar

PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOMECLASSPATH PATH

5source /etc/profile

6验证是否安装成功：java–version

-----------------------------------------------------------------------------------------

然后配置并启动Hadoop

运行下面命令，将最新版的hadoop下载下来：

[wyp@wyp hadoop]$ wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.2.0/hadoop-2.2.0.tar.gz

　　当然，你也可以用下载的软件到上面的地址去下载。上面的命令是一行，由于此处太长了，所以强制弄成两行。假设下载好的hadoop存放在/home/wyp/Downloads/hadoop目录中，由于下载下来的hadoop是压缩好的，请将它解压，运行下面的命令：

[wyp@wyp hadoop]$ tar -xvf hadoop-2.2.0.tar.gz

解压之后，你将会看到如下目录结构：

[wyp@wyp hadoop]$ ls -l

total 56

drwxr-xr-x. 2 wyp wyp 4096 Oct 7 14:38 bin

drwxr-xr-x. 3 wyp wyp 4096 Oct 7 14:38 etc

drwxr-xr-x. 2 wyp wyp 4096 Oct 7 14:38 include

drwxr-xr-x. 3 wyp wyp 4096 Oct 7 14:38 lib

drwxr-xr-x. 2 wyp wyp 4096 Oct 7 14:38 libexec

-rw-r--r--. 1 wyp wyp 15164 Oct 7 14:46 LICENSE.txt

drwxrwxr-x. 3 wyp wyp 4096 Oct 28 14:38 logs

-rw-r--r--. 1 wyp wyp 101 Oct 7 14:46 NOTICE.txt

-rw-r--r--. 1 wyp wyp 1366 Oct 7 14:46 README.txt

drwxr-xr-x. 2 wyp wyp 4096 Oct 28 12:37 sbin

drwxr-xr-x. 4 wyp wyp 4096 Oct 7 14:38 share

下面是配置Hadoop的步骤：首先设置好Hadoop环境变量：

[wyp@wyp hadoop]$ sudo vim /etc/profile

在/etc/profile文件的末尾加上以下配置

export HADOOP_DEV_HOME=/home/wyp/Downloads/hadoop

export PATH=$PATH:$HADOOP_DEV_HOME/bin

export PATH=$PATH:$HADOOP_DEV_HOME/sbin

export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME}

export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME}

export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME}

export YARN_HOME=${HADOOP_DEV_HOME}

export HADOOP_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

然后按:wq保存。为了让刚刚的设置生效，运行下面的命令

[wyp@wyp hadoop]$ sudo source /etc/profile

接下来修改Hadoop的hadoop-env.sh配置文件，设置jdk所在的路径：

[wyp@wyp hadoop]$ vim etc/hadoop/hadoop-env.sh

在里面找到JAVA_HOME，并将它的值设置为你电脑jdk所在的绝对路径

# The java implementation to use.

export JAVA_HOME=/home/wyp/Downloads/jdk1.7.0_45

设置好之后请保存退出。接下来请配置好一下几个文件（都在hadoop目录下的etc/hadoop目录下）：

----------------core-site.xml

<name>fs.default.name</name>

<value>hdfs://localhost:8020</value>

</property>

------------------------- yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

------------------------ mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapred.system.dir</name>

<value>file:/opt/cloud/hadoop_space/mapred/system</value>

</property>

<name>mapred.local.dir</name>

<value>file:/opt/cloud/hadoop_space/mapred/local</value>

</property>

----------- hdfs-site.xml

<name>dfs.namenode.name.dir</name>

<value>file:/opt/cloud/hadoop_space/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/opt/cloud/hadoop_space/dfs/data</value>

<description>Determines where on the local

filesystem an DFS data node should store its blocks.

If this is a comma-delimited list of directories,

then data will be stored in all named

directories, typically on different devices.

Directories that do not exist are ignored.

</description>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

上面的配置弄好之后，现在来进行测试，看看配置是否正确。首先格式化一下HDFS,如下命令：

[wyp@wyp hadoop]$ hdfs namenode -format

13/10/28 16:47:33 INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

..............此处省略好多文字......................

************************************************************/

13/10/28 16:47:33 INFO namenode.NameNode: registered UNIX signal

handlers for [TERM, HUP, INT]

Formatting using clusterid: CID-9931f367-92d3-4693-a706-d83e120cacd6

13/10/28 16:47:34 INFO namenode.HostFileManager: read includes:

HostSet(

)

13/10/28 16:47:34 INFO namenode.HostFileManager: read excludes:

HostSet(

)

..............此处也省略好多文字......................

13/10/28 16:47:38 INFO util.ExitUtil: Exiting with status 0

13/10/28 16:47:38 INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at wyp/192.168.142.138

************************************************************/

[wyp@wyp hadoop]$

大概出现上面的输出，好了，去启动一下你的Hadoop吧，命令如下：

[wyp@wyp hadoop]$ sbin/start-dfs.sh

[wyp@wyp hadoop]$ sbin/start-yarn.sh

查看一下是否安装好了Hadoop，命令如下：

[wyp@wyp hadoop]$ jps

9582 Main

9684 RemoteMavenServer

7011 DataNode

7412 ResourceManager

17423 Jps

7528 NodeManager

7222 SecondaryNameNode

6832 NameNode

[wyp@wyp hadoop]$

　　如何关闭Hadoop各个服务：其中的jps是jdk自带的，如果出现NameNode、SecondaryNameNode、NodeManager、ResourceManager、DataNode这五个进程,那就恭喜你了，你的Hadoop已经安装好了

[wyp@wyp hadoop]$ sbin/stop-dfs.sh

[wyp@wyp hadoop]$ sbin/stop-yarn.sh

上一篇：lmbench installation

下一篇：我的友情链接

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

单机上部署Hadoop2.2.0

单机上部署Hadoop2.2.0

51CTO博客