hadoop1.0没有HA,可以添加NFS做为metadata存储备份,如果NN挂了,可以借助NFS上文件重新建立NN,这样虽然不能实现无间断服务,但可以保障集群数据不丢失。修改hdfs-site.xml配置如下:

 

<property>
  <name>dfs.name.dir</name>
  <value>/data/dfs/nn,/nfs/dfs/nn</value>
</property>

引入NFS后,会带来新问题:

  1. 如果NFS无法访问,NN无法启动
  2. 如果NFS中途故障,机器可以读取文件,但不能写入(写操作会挂住)

所以还需要使用nagios把NFS监控起来(官网搜索 check_nfs_mountpoint.sh)

 

--end