redis超时时间单位 redis 超时时间设置

转载

mob6454cc6ccc8a 2023-08-15 06:56:16

文章标签 redis超时时间单位 cluster-node-timeout timeout redis cluster 文章分类 Redis 数据库

参考文章：http://doc.redisfans.com/topic/cluster-spec.html

集群节点的超时时限redis.conf配置默认值是：

cluster-node-timeout 15000

一、节点失效检测

1.集群中当一个节点向另一个节点发送PING命令，但是目标节点未在给定的时限内返回PING命令的回复时，那么发送命令的节点会将目标节点标记为PFAIL(possible failuer，可能已失效)；
等待节点回复的时限称为节点超时时限（node timeout），是一个节点选项（node-wise setting）;

2.每次节点发送对其它节点的PING命令的时候，它都会随机的广播三个它所知道的节点信息，这些信息里面的其中一项就是说明节点是否已经被标记为PFAIL或者FAIL;

3.当节点接收到其它节点发送来的信息时，它会记下哪些被其它节点标记为失效的节点，这称之为失效报告（failure report）;

4.如果节点已经将某个节点标记为PFAIL，并且根据节点所收到的失效报告显示，集群中的大部分其它主节点也认为哪个主节点进入了失效状态，那么节点将会把哪个节点标记为失效状态FAIL;

5.一旦某个节点被标记为FAIL，关于这个节点已失效的信息就会广播到整个集群中取，所有接收到这条信息的节点都会将失效信息标记为FAIL;

简单来说一个节点要将另外一个节点标记为失效，必须要询问其它节点的意见，并且得到大部分主节点的同意才行；

因为过期的失效报告会被移除，所以主节点要将某个节点标记为失效FAIL的话，必须以最近接收到的失效报告为根据；

在一下两种情况中失效FAIL状态会被移除：

1.如果被标记为FAIL的是从节点，那么这个节点重新上线时，FAIL标记就会被移除；

保持（retaining）从节点的FAIL失效状态是没有意义的，因为它不处理任何槽，一个节点是否处于FAIL状态，决定了这个从节点在有需要的时候能否被提升为主节点；

2.如果一个主节点被打上FAIL标记之后，经过了节点超时时限的四倍时间，在加上10秒中之后，针对这个主节点槽的故障转移操作仍未完成，并且这个主节点已经重新上线的话，那么移除针对这个节点的FAIL标记；

在第二种情况中，如果故障转移未能顺利完成，并且主节点重新上线，那么集群就继续使用原来的主节点，从而免去管理员介入的必要；

二、集群状态检测

每当集群发生配置变化时（可能是哈希槽更新，也可能是某个节点进入失效状态），集群中的每个节点都会对它所知道的节点进行扫描（scan）;

一旦配置完毕，集群就会进入两种状态中的一种：

FAIL：集群不能正常工作，当集群中有某个节点进入失效状态时，集群不能处理任何命令请求，对于每个命令请求，集群节点都返回错误回复；

OK：集群可以正常工作，负责处理全部16384个槽节点中，没有一个被标记为FAIL状态；

这说明即使集群中只有一部分哈希槽不可以正常使用，整个集群也会停止处理任何命令；

不过节点从出现问题到被标记为FAIL状态这段时间里，集群仍然会正常运行，所以集群在某些时候，仍然可能只能处理针对16384个槽的其中的一个子集的命令；

以下是集群进入FAIL状态的两种情况：

（1）至少有一个哈希槽不可以用，因为因为负责处理这个槽的节点进入了FAIL装填；

（2）集群中大部分主节点都进入下线状态，当大部分主节点都进入FAIL状态是，集群也会进入FAIL状态；

第二个检查是必须的，因为要将一个节点从PFAIL状态改变为FAIL状态，必须要有大部分主节点进行投票决定，但是，当集群中大部分主节点进入失效状态时，单凭一两个节点是没有办法将一个节点标记为FAIL状态的；

因此，有了第二个检查条件，只要集群中的大部分主节点进入了下线状态，那么集群就可以在不请求主节点意见的情况下，将某个节点判断为FAIL状态，从而让整个集群停止命令请求；

三、从节点选举

一旦某个主节点进入了FAIL状态，如果这个主节点有一个或者多个从节点存在，那么其中一个从节点会被升级为主节点，而其它从节点会开始对这个新主节点进行复制；

新主节点由已下线的主节点的树下所有从节点自行选举产生，一下是选举条件：

（1）这个节点是已下线主节点的从节点；

（2）已下线主节点处理槽数非空；

（3）从节点的数据被认为是可靠的，也即时，主从节点之间的复制链接（repliaction link）的断线时长不能超过超时时限（node timeout）乘以REDIS_CLUSTER_SLAVE_VALIDITY_MULT 常量得出的值；

如果一个从节点满足了以上所有条件，那么这个从节点将会向集群中的其它主节点发送授权请求，询问它们，是否允许自己（从节点）升级为主节点。

如果发送授权请求的从节点满足一下属性，那么主节点将向从节点返回FAILOVER_AUTH_GRANTED授权，同意从节点的升级要求：

（1）发送授权请求的是一个从节点，并且它所属的主节点处于FAIL状态；

（2）在已下线的主节点的所有从节点中，这个从节点的节点ID在排序中是最小的；

（3）这个从节点处于正常运行状态，它没有被标记为FAIL状态，也没有被标记为PFAIL状态；

一旦某个从节点在给定的时间内得到大部分主节点的授权，它就会执行以下故障转移操作：

（1）通过PONG数据包（package）告知其它节点，这个节点现在是主节点了；

（2）通过PONG数据包告知其它节点，这个节点是一个已经升级的从节点（promoted salve）;

（3）接管（claming）所有由已下线主节点负责处理的哈希槽；

（4）显式的向所有的节点广播一个PONG数据包，加速其它节点识别这个节点的速度，而不是等待定时的PING/PONG数据包；

所有其它节点都会根据新的主节点对配置进行相应的更新，特别的：

（1）所有被新主节点接管的槽会被更新；

（2）已下线主节点的所有从节点会察觉到 PROMOTED 标志，并开始对新的主节点进行复制；

（3）如果已下线的主节点重新回到上线状态，那么它会察觉到 PROMOTED 标志，并将自身调整为现任主节点的从节点。

在集群的生命周期中，如果一个带有 PROMOTED 标识的主节点因为某些原因转变成了从节点，那么该节点将丢失它所带有的 PROMOTED 标识。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 摄像头寻迹 python摄像头拍照

下一篇：java 怎么打印json java直接打印对象

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

redis超时时间单位 redis 超时时间设置

redis超时时间单位 redis 超时时间设置

51CTO博客