NameNode使用两个文件来保留其命名空间:fsimage,它是命名空间和编辑的最新检查点,是自检查点以来命名空间更改的日志(日志)。当NameNode启动时,它会合并fsimage和edits journal以提供文件系统元数据的最新视图。NameNode然后用新的HDFS状态覆盖fsimage并开始一个新的编辑日志。
Checkpoint节点定期创建命名空间的检查点。它从活动的NameNode下载fsimage和editlog,在本地合并它们,并将新映像上传回活动的NameNode。Checkpoint节点通常在与NameNode不同的机器上运行,因为它的内存要求与NameNode的顺序相同。Checkpoint节点由配置文件中指定的节点上的bin / hdfs namenode -checkpoint启动。
检查点(或备份)节点及其随附Web界面的位置是通过dfs.namenode.backup.address和dfs.namenode.backup.http-address配置变量配置的。
Checkpoint节点上检查点进程的开始由两个配置参数控制。
dfs.namenode.checkpoint.period,默认设置为1小时,指定两个连续检查点之间的最大延迟
dfs.namenode.checkpoint.txns,默认设置为1百万,定义NameNode上的未经检查的事务的数量,这将强制紧急检查点,即使尚未达到检查点周期。
通过这两个参数可以控制editlog的大小,并定时的合并,可靠性更好。
Checkpoint节点将最新的检查点存储在与NameNode的目录结构相同的目录中。这允许检查点图像在必要时始终可供NameNode读取。请参阅导入检查点。
可以在群集配置文件中指定多个检查点节点。