SecondaryNameNode会周期性地把NameNode中的fsimage镜像文件合并到editlog操 namenode ha

转载

mob6454cc6dcf7f 2024-05-10 16:31:14

文章标签 hadoop hdfs 大数据 HDFS 共享文件 文章分类 云原生云计算

HA概述
1）所谓HA，即高可用（7*24小时不中断服务）
2）实现高可用最关键的策略是消除单点故障。
3）Hadoop2.0之前，在HDFS集群中NameNode存在单点故障。
4）NameNode主要在一下两个方面影响HDFS集群
NameNode机器发生意外，如宕机，集群将无法使用，知道管理员重启。
NameNode机器需要升级，包括软件升级，硬件升级，此时集群也无法使用
HDFS HA功能通过配置Active/StandBy两NameNodes实现在集群中对NameNode的热备来解决上述问题。如果出现故障，如机器崩溃或机器需要升级维护，这时可以通过此方法将NameNode很快切换到另一台机器。

HA的namenode主要分为共享editLog机制，和ZKFC对namenode状态控制。

SecondaryNameNode会周期性地把NameNode中的fsimage镜像文件合并到editlog操 namenode ha_大数据

SecondaryNameNode会周期性地把NameNode中的fsimage镜像文件合并到editlog操 namenode ha_hdfs_02

1）状态为active的namenode向分布式共享文件系统journalnode写入编辑日志editlog，状态为standby为了与active状态的namenode保持一致，在分布式共享文件系统中读入文件。
2）每个datanode会向所有namenode报告自身状态。
3）zkfc最为轻量级故障转移器，基于zookeeper实现，是由namenode运行的独立线程。在启动zkfc时，他会注册healthmonitor和activestandbyelector服务组件，同时会向注册的服务组件注册响应的回调方法。
healthmonitor负责监控namenode状态变化，当namenode状态改变时，会调用zkfc进行主备选举。
activestandbyelector负责主备选举，内部调用zk选举逻辑。当选举结束时，调用zkfc相应方法，切换主namenode状态，或者备namenode状态。

主备切换逻辑

SecondaryNameNode会周期性地把NameNode中的fsimage镜像文件合并到editlog操 namenode ha_大数据_03

SecondaryNameNode会周期性地把NameNode中的fsimage镜像文件合并到editlog操 namenode ha_hadoop_04

1）heathmoiniter监控namenode状态
2）当namenode状态改变，调用zkfc进行主备选举
3）zkfc判断是否需要进行主备选举
4）当需要进行选举时，调用activestandbyelector组件
5）activestandbyelector组件负责与zk进行交互，尝试在zk上创建临时节点。由于zk的最终一致性，只会有一个activestandbyelector创建节点成功，成功创建节点的activestandbyelector对应的namenode成为主namenode。
6)activestandbyelector进行回调zkfc，通知切换namenode状态
7）zkfc会调用HAservicePool RPC接口的方法来切换namenode状态。

防止脑裂
脑裂产生的情况有以下几种：
1）由于zookeeper的假死
2）长时间的垃圾回收或者网络异常等
脑裂的情况下，会出现两个active状态的namenode对外提供服务，无法保证数据一致性。
防止脑裂的步骤如下：
1）在创建临时节点的同时，创建持久节点。
2）正常关闭时，临时节点和持久节点都会被删除。
3）异常关闭时，还会存在持久节点。此时可以采用hadoop自带的隔离机制sshfence（直接通过端口查找进程id，kill进程）或shellfence方式（执行已有的shell脚本），执行fencing过程。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。