一、Sentinel说明

在主从复制中,master 挂掉了,那么整个就崩掉了,因为 slave 不能写数据。

所以哨兵的作用就是让 Redis 的主从复制高可用

在 master 挂掉后,Sentinel 在选一个 slave 当做 master,就算之前的那个 master 启动起来了,也只能当 slave。

工作流程:

  1. 多个 Sentinel 发现并确认 master 有问题
  2. 选举一个 Sentinel 作为领导
  3. 选取一个 slave 作为新的 master
  4. 通知其余 slave 成为新的 master 的 slave
  5. 通知客户端主从变化
  6. 等待老的 master 复活成为新的 master 的 slave
二、配置

1、这里以一主两从的形式配置,以三个进程的方式演示,先启动三个 Redis 配置如下:

主配置文件

pidfile /var/run/redis.pid
dir "/root/redis/data"
logfile "6379.log"
daemonize yes
port 6379

从配置文件1

pidfile /var/run/redis2.pid
dir "/root/redis/data2"
logfile "6380.log"
daemonize yes
port 6380
slaveof 127.0.0.1 6379
slave-read-only yes

从配置文件2

pidfile /var/run/redis3.pid
dir "/root/redis/data3"
logfile "6381.log"
daemonize yes
port 6381
slaveof 127.0.0.1 6379
slave-read-only yes

启动三个Redis

redis-server redis_6379.conf
redis-server redis_6380.conf
redis-server redis_6381.conf

2、搭建哨兵,哨兵也可以当做一个 Redis 服务器,分别创建三个哨兵配置文件:sentinel_26379.conf sentinel_26380.conf sentinel_26381.conf

配置文件:sentinel_26379.conf

port 26379
daemonize yes
dir "/root/redis/sentinel_data"
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel.log"

sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

配置文件:sentinel_26380.conf

port 26380
daemonize yes
dir "/root/redis/sentinel2_data"
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel2.log"

sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

配置文件:sentinel_26381.conf

port 26381
daemonize yes
dir "/root/redis/sentinel3_data"
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel3.log"

sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

启动三个哨兵

redis-sentinel sentinel_26379.conf
redis-sentinel sentinel_26380.conf
redis-sentinel sentinel_26381.conf

3、哨兵更多配置参数

sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000


sentinel monitor <master-name> <ip> <redis-port> <quorum>
# 告诉sentinel去监听地址为ip:port的一个master,这里的master-name可以自定义,quorum是一个数字,指明当有多少个sentinel认为一个master失效时,master才算真正失效
    
    
sentinel auth-pass <master-name> <password>
# 设置连接master和slave时的密码,注意的是sentinel不能分别为master和slave设置不同的密码,因此master和slave的密码应该设置相同。


sentinel down-after-milliseconds <master-name> <milliseconds> 
# 这个配置项指定了需要多少失效时间,一个master才会被这个sentinel主观地认为是不可用的。 单位是毫秒,默认为30秒


sentinel parallel-syncs <master-name> <numslaves> 
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。


sentinel failover-timeout <master-name> <milliseconds>
"""
failover-timeout 可以用在以下这些方面:     
1. 同一个sentinel对同一个master两次failover之间的间隔时间。   
2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。    
3.当想要取消一个正在进行的failover所需要的时间。    
4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了。
"""
三、python客户端连接哨兵
import redis
from redis.sentinel import Sentinel

# 连接哨兵服务器(主机名也可以用域名)
sentinel = Sentinel([('127.0.0.1', 26379),
                     ('127.0.0.1', 26380),
                     ('127.0.0.1', 26381)
		     ],
                    socket_timeout=5)


print(sentinel)
# 获取主服务器地址
master = sentinel.discover_master('mymaster')
print(master)




# 获取从服务器地址
slave = sentinel.discover_slaves('mymaster')
print(slave)
学习之旅