1. 部署环境
系统: CentOS 6.3
JDK和hadoop的下载直接参考分布式安装...
2. 伪分布式环境
不需要配置/etc/hosts
本机也需要免密码ssh登录
ssh localhost
3. 配置修改
1. conf/core-site.xml
<configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property>
2. conf/hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
3. conf/mapred-site.xml
<configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration>
4. conf/hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_67
5. 不需要修改masters和slave文件
6. 格式化名称节点
cd hadoop-1.2.1 ./bin/hadoop namenode -format 如果最后面的信息有下面这样的表示成功... 14/08/30 11:37:05 INFO common.Storage: Storage directory /home/hadoop/hadoop-1.2.1/tmp/dfs/name has been successfully formatted.
4. 启动hadoop
./bin/start-all.sh
5. 启动后的检查
通过jps命令查看, java的进程统计列表
/usr/java/jdk1.7.0_67/bin/jps