Redis在3.0版正式引入了集群这个特性。Redis集群是一个分布式(distributed)、容错(fault-tolerant)的 Redis内存K/V服务, 集群可以使用的功能是普通单机 Redis 所能使用的功能的一个子集(subset),比如Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性能,在高负载的情况下可能会导致不可预料的错误。
Redis集群的几个重要特征:
(1). Redis 集群的分片特征在于将键空间分拆了16384个槽位,每一个节点负责其中一些槽位。
(2). Redis提供一定程度的可用性,可以在某个节点宕机或者不可达的情况下继续处理命令.
(3). Redis 集群中不存在中心(central)节点或者代理(proxy)节点, 集群的其中一个主要设计目标是达到线性可扩展性(linear scalability)。
1. Redis的数据分片(Sharding)
Redis 集群的键空间被分割为 16384 (2^14)个槽(slot), 集群的最大节点数量也是 16384 个(推荐的最大节点数量为 1000 个),同理每个主节点可以负责处理1到16384个槽位。
当16384个槽位都有主节点负责处理时,集群进入”稳定“上线状态,可以开始处理数据命令。当集群没有处理稳定状态时,可以通过执行重配置(reconfiguration)操作,使得每个哈希槽都只由一个节点进行处理。
重配置指的是将某个/某些槽从一个节点移动到另一个节点。一个主节点可以有任意多个从节点, 这些从节点用于在主节点发生网络断线或者节点失效时, 对主节点进行替换。
集群的使用公式CRC16(Key)&16383计算key属于哪个槽:HASH_SLOT = CRC16(key) mod 16384
CRC16其结果长度为16位。
2. Redis集群节点
部分内容摘自附录2。Redis 集群中的节点不仅要记录键和值的映射,还需要记录集群的状态,包括键到正确节点的映射。它还具有自动发现其他节点,识别工作不正常的节点,并在有需要时,在从节点中选举出新的主节点的功能。
为了执行以上列出的任务, 集群中的每个节点都与其他节点建立起了“集群连接(cluster bus)”, 该连接是一个 TCP 连接, 使用二进制协议进行通讯。
节点之间使用 Gossip 协议 来进行以下工作:
a). 传播(propagate)关于集群的信息,以此来发现新的节点。
b). 向其他节点发送 PING 数据包,以此来检查目标节点是否正常运作。
c). 在特定事件发生时,发送集群信息。
除此之外, 集群连接还用于在集群中发布或订阅信息。
集群节点不能前端代理命令请求, 所以客户端应该在节点返回 -MOVED
或者 -ASK
转向(redirection)错误时, 自行将命令请求转发至其他节点。
客户端可以自由地向集群中的任何一个节点发送命令请求, 并可以在有需要时, 根据转向错误所提供的信息, 将命令转发至正确的节点, 所以在理论上来说, 客户端是无须保存集群状态信息的。但如果客户端可以将键和节点之间的映射信息保存起来, 可以有效地减少可能出现的转向次数, 籍此提升命令执行的效率。
每个节点在集群中由一个独一无二的 ID标识, 该 ID 是一个十六进制表示的 160 位随机数,在节点第一次启动时由 /dev/urandom 生成。节点会将它的 ID 保存到配置文件, 只要这个配置文件不被删除, 节点就会一直沿用这个 ID 。一个节点可以改变它的 IP 和端口号, 而不改变节点 ID 。 集群可以自动识别出IP/端口号的变化, 并将这一信息通过 Gossip协议广播给其他节点知道。
下面是每个节点都有的关联信息, 并且节点会将这些信息发送给其他节点:
a). 节点所使用的 IP 地址和 TCP 端口号。
b). 节点的标志(flags)。
c). 节点负责处理的哈希槽。
b). 节点最近一次使用集群连接发送 PING 数据包(packet)的时间。
e). 节点最近一次在回复中接收到 PONG 数据包的时间。
f). 集群将该节点标记为下线的时间。
g). 该节点的从节点数量。
h). 如果该节点是从节点的话,那么它会记录主节点的节点 ID 。 如果这是一个主节点的话,那么主节点 ID 这一栏的值为 0000000。
在了解Redis Cluster的集群基本特征后,我们首先搭建出这个Redis Cluster集群。
3. 安装Redis 3.0.x
当前最新版为3.0.1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | wget http://download.redis.io/releases/redis-3.0.1.tar.gz tar xvzf redis-3.0.1.tar.gz cdredis-3.0.1/ make-j #apt-get install tcl maketest ###将redis安装到/usr/local/redis3上 #cd src && make PREFIX=/usr/local/redis3 install ###创建符号链接 #ls /usr/local/redis3/bin/redis-* /usr/local/redis3/bin/redis-benchmark/usr/local/redis3/bin/redis-check-dump/usr/local/redis3/bin/redis-sentinel /usr/local/redis3/bin/redis-check-aof/usr/local/redis3/bin/redis-cli/usr/local/redis3/bin/redis-server #for i in `cd /usr/local/redis3/bin; ls redis-*` do ln-s/usr/local/redis3/bin/$i/usr/local/bin/$i done; #mkdir -p /usr/local/redis3/conf #ln -sf /usr/local/redis3/conf /etc/redis3 ###检查版本信息 redis-cli-v redis-cli3.0.1 |
4. Redis Cluster配置
运行在集群模式的Redis实例与普通的Redis实例有所不同,集群模式需要通过配置启用cluster特性,开启集群模式后的Redis实例便可以使用集群特有的命令和特性了.
下面是一个最少选项的集群的配置文件:
1 2 3 4 5 | port7001 cluster-enabled yes cluster-config-file nodes.conf cluster-node-timeout5000 appendonly yes |
文件中的 cluster-enabled 选项用于开实例的集群模式, 而 cluster-conf-file 选项则设定了保存节点配置文件的路径, 默认值为 nodes.conf。该节点配置文件无须人为修改,它由Redis集群在启动时自动创建, 并在有需要时自动进行更新。
若要让集群正常运作至少需要三个主节点,我们的环境中,每个主节点附带一个从节点,所以一共六个节点。端口为7001-7006。
在/app/redis3, 并创建六个以端口号为名字的子目录, 稍后我们在将每个目录中运行一个 Redis 实例:
1 2 3 4 5 | cd/app/redis3 mkdir700170027003700470057006 cp/etc/redis3/conf/redis.conf/app/redis3/7001/ ...... cp/etc/redis3/conf/redis.conf/app/redis3/7006/ |
将redis.conf里的端口号修改为对应的端口。下面我们打开对应的目录,启动redis实例即可。
1 2 3 | cd/app/redis3/7001;nohup redis-server redis.conf& cd/app/redis3/7002;nohup redis-server redis.conf& ...... |
实例打印的日志显示, 因为 nodes.conf 文件不存在, 所以每个节点都为它自身指定了一个新的 ID ,
1 2 3 4 5 | /app/redis3/7006# tail -f nohup.out 27040:M09May22:53:50.197*No cluster configuration found,I'm1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 /app/redis3/7006# cat nodes.conf d2b437ca8b9007dcdb63ac16210f6540860361e3:0myself,master-000connected vars currentEpoch0lastVoteEpoch0 |
现在我们已经有了六个正在运行中的 Redis 实例, 接下来我们需要使用这些实例来创建集群。
通过使用 Redis 集群命令行工具 redis-trib , 编写节点配置文件的工作可以非常容易地完成: redis-trib 位于 Redis 源码的 src 文件夹中, 它是一个 Ruby 程序, 这个程序通过向实例发送特殊命令来完成创建新集群, 检查集群, 或者对集群进行重新分片(reshared)等工作。这里通过create命令来创建集群,指定replicas=1,即每一个主实例有一个从实例。redis-trib 会打印出一份预想中的配置给你看, 如果你觉得没问题的话, 就可以输入 yes , redis-trib 就会将这份配置应用到集群当中,让各个节点开始互相通讯,最后可以得到如下信息
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | ~/redis-3.0.1/src# apt-get install ruby gem ~/redis-3.0.1/src# gem sources -a http://ruby.taobao.org/ ~/redis-3.0.1/src# gem install redis ~/redis-3.0.1/src# cp redis-trib.rb /usr/local/redis3/bin/ ~/redis-3.0.1/src# ln -sf /usr/local/redis3/bin/redis-trib.rb /usr/bin/redis-trib.rb ~/redis-3.0.1/src# redis-trib.rb create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006 M:1984c27297c6ef50bbfcbd35c11b93cc40ba17e4127.0.0.1:7001 slots:0-5460(5461slots)master M:481e256be4c724f5a2c64a761e52b4be61ca45b4127.0.0.1:7002 slots:5461-10922(5462slots)master M:b5b652fa02d9999861e66c843b01fd2700c02adf127.0.0.1:7003 slots:10923-16383(5461slots)master S:821ec823dc0c2d4f65319e84fe74157fb1014155127.0.0.1:7004 replicates1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 S:b3b8541b9520d707180d56a2fb3cf3ee6895ed10127.0.0.1:7005 replicates481e256be4c724f5a2c64a761e52b4be61ca45b4 S:d2b437ca8b9007dcdb63ac16210f6540860361e3127.0.0.1:7006 replicates b5b652fa02d9999861e66c843b01fd2700c02adf CanIset the above configuration?(type'yes'toaccept): [OK]All nodes agree about slots configuration. >>>Check foropen slots... >>>Check slots coverage... [OK]All16384slots covered. |
以上信息的其中一部分可以通过向集群中的任意节点(主节点或者从节点都可以)发送 CLUSTER NODES 命令来获得。该命令还可以获得节点 ID , IP 地址和端口号, 标志(flag), 最后发送 PING 的时间, 最后接收 PONG 的时间, 连接状态, 节点负责处理的槽。
1 2 3 4 5 6 7 | redis-cli-p7001cluster nodes 481e256be4c724f5a2c64a761e52b4be61ca45b4127.0.0.1:7002master-014311861191742connected5461-10922 b3b8541b9520d707180d56a2fb3cf3ee6895ed10127.0.0.1:7005slave481e256be4c724f5a2c64a761e52b4be61ca45b4014311861206775connected d2b437ca8b9007dcdb63ac16210f6540860361e3127.0.0.1:7006slave b5b652fa02d9999861e66c843b01fd2700c02adf014311861191746connected b5b652fa02d9999861e66c843b01fd2700c02adf127.0.0.1:7003master-014311861186733connected10923-16383 821ec823dc0c2d4f65319e84fe74157fb1014155127.0.0.1:7004slave1984c27297c6ef50bbfcbd35c11b93cc40ba17e4014311861201764connected 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4127.0.0.1:7001myself,master-001connected0-5460 |
5. 连接Redis集群
通过上面的输出,我们可以看出Redis三个主节点的slot范围。一个 Redis 客户端可以向集群中的任意节点(包括从节点)发送命令请求。我们首先连接第一个节点:
1 2 3 4 5 6 7 | redis-cli-p7001 127.0.0.1:7001>seta1 (error)MOVED15495127.0.0.1:7003 127.0.0.1:7001>geta (error)MOVED15495127.0.0.1:7003 127.0.0.1:7001>setb1 OK |
节点会对命令请求进行分析和key的slot计算,并且会查找这个命令所要处理的键所在的槽。如果要查找的哈希槽正好就由接收到命令的节点负责处理, 那么节点就直接执行这个命令。
另一方面, 如果所查找的槽不是由该节点处理的话, 节点将查看自身内部所保存的哈希槽到节点 ID 的映射记录, 并向客户端回复一个 MOVED 错误。上面的错误信息包含键 x 所属的哈希槽15495, 以及负责处理这个槽的节点的 IP 和端口号 127.0.0.1:7003 。
虽然我们用Node ID来标识集群中的节点, 但是为了让客户端的转向操作尽可能地简单, 节点在 MOVED 错误中直接返回目标节点的 IP 和端口号, 而不是目标节点的 ID 。客户端应该记录槽15495由节点127.0.0.1:7003负责处理“这一信息, 这样当再次有命令需要对槽15495执行时, 客户端就可以加快寻找正确节点的速度。这样,当集群处于稳定状态时,所有客户端最终都会保存有一个哈希槽至节点的映射记录,使得集群非常高效: 客户端可以直接向正确的节点发送命令请求, 无须转向、代理或者其他任何可能发生单点故障(single point failure)的实体(entiy)。
^^