术语

1. Namenode: HDFS采用master/slave架构。一个HDFS集群由1个Namenode和多个Datanodes组成。Namenode是一个中心服务器。负责datanode节点映射、执行文件重命名等。

2.Datanode,节点,负责客户端的读写请求。

3. Secondarynamenode,用来保存namenode对HDFS metadata信息备份。

4. Jobtracker和Tasktracker。master负责调度task运行在slave,slave  负责执行task。

执行

1. 对HDFS进行格式化

bin/hadoop namenode -format

2. 启动Hadoop守护进程

bin/start-all.sh

注:1. Hadoop守护进程的日志写到$HADOOP_HOME/logs

   2.NameNode和JobTracker网络接口

   Namenode - http://localhost:50070

   JobTracker - http://localhost:50030

3. 将输入文件拷贝到分布式文件系统

bin/hadoop fs -put conf input

4. 停止守护进程

bin/stop-all.sh