操作hadoop的经验积累

转载

mob604756fe7577 2013-08-20 20:27:00

文章标签 hadoop sed hadoop集群临时文件正常运行 文章分类 MySQL 数据库

操作hadoop的经验积累

Hadoop namenode –format

在执行格式化-format命令时，要避免namenode的namdespaceid与datanode的namespaceid的不一致。这是因为每格式化一次就会产生name,data,temp等临时文件记录信息，多次格式化会产生很多的name,data,temo，这样容易导致id的不同，使hadoop不能正常运行。每次执行格式化—format命令时，就需要将datanode和namenode上原来的data,temp文件删除。

查看群集状态，

$ ./hadoop dfsadmin-report

ConfiguredCapacity: 53895745536 (50.19 GB)

Present Capacity:8199200768 (7.64 GB)

DFS Remaining:8199159808 (7.64 GB)

DFS Used: 40960 (40KB)

DFS Used%: 0%

Under replicatedblocks: 0

Blocks with corruptreplicas: 0

Missing blocks: 0

-------------------------------------------------

Datanodesavailable: 1 (1 total, 0 dead)

Name:127.0.0.1:50010

Decommission Status: Normal

ConfiguredCapacity: 53895745536 (50.19 GB)

DFS Used: 40960 (40KB)

Non DFS Used:45696544768 (42.56 GB)

DFS Remaining:8199159808(7.64 GB)

DFS Used%: 0%

DFS Remaining%:15.21%

Last contact: MonAug 19 06:36:47 EDT 2013

在安装hadoop集群时，把要安装的软件解压到集群内的所有机器上，软件的安装目录也要一致。集群里所有机器中的hadoop_home目录代表安装的根路径，集群中的机器要求hadoop_home路径一致。如果集群中的机器环境一致，可以采用这种方法统一安装和配置集群的机器，先在一台机器上配置好，然后把配置好的软件的整个文件夹复制到集群中其他机器的目录中，这样就可以保障集群中的机器配置一致性。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。