Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode。
Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/
中,伪分布式需要修改3个配置文件 core-site.xml 、hdfs-site.xml和 mapred-site.xml 。Hadoop的配置文件是 xml 格式,每个配置以声明 property 的 name 和 value 的方式来实现。
core-site.xml文件
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
hdfs-site.xml文件
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
mapred-site.xml文件
如何没有这个文件使用mapred-site.xml.template文件,
修改后在重命名为mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
配置完成后,执行 namenode 的格式化:
bin/hadoop namenode -format
成功标识:
显示 Exiting with status 0
namenode :SHUDOWN_MSG:
输入命令,启动进程
sbin/start-all.sh
查看进程启动情况:
jps
成功标志
NameNode
SecondaryNameNode
Jps
Datanode
NodeManager
ResourceManager
打开浏览器,输入网址
http://localhost:8088 或者 http://localhost:50030 (MapReduce的Web界面)
http://localhost:50070 (HDFS的Web界面)