一、概述

​ Redis3.0版本之后支持Cluster.

1.1、redis cluster的现状

  目前redis支持的cluster特性:

  1):节点自动发现

  2):slave->master 选举,集群容错

  3):Hot resharding:在线分片

  4):进群管理:cluster xxx

  5):基于配置(nodes-port.conf)的集群管理

  6):ASK 转向/MOVED 转向机制.

1.2、redis cluster 架构

  1)redis-cluster架构图

架构细节:

  (1)所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽.

  (2)节点的fail是通过集群中超过半数的节点检测失效时才生效.

  (3)客户端与redis节点直连,不需要中间proxy层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可

  (4)redis-cluster把所有的物理节点映射到[0-16383]slot上,cluster 负责维护node<->slot<->value

  1. redis-cluster选举:容错

(1)领着选举过程是集群中所有master参与,如果半数以上master节点与master节点通信超过(cluster-node-timeout),认为当前master节点挂掉.

(2):什么时候整个集群不可用(cluster_state:fail),当集群不可用时,所有对集群的操作做都不可用,收到((error) CLUSTERDOWN The cluster is down)错误

​   a:如果集群任意master挂掉,且当前master没有slave.集群进入fail状态,也可以理解成进群的slot映射[0-16383]不完成时 进入fail状态.

​ 那么为什么任意一个节点挂了(没有从节点)这个集群就挂了呢? -> 因为集群内置了16384个slot(哈希槽),并且把所有的物理节点映射到了这16384[0-16383]个slot上,或者说把这些slot均等的分配给了各个节点。当需要在Redis集群存放一个数据(key-value)时,redis会先对这个key进行crc16算法,然后得到一个结果。再把这个结果对16384进行求余,这个余数会对应[0-16383]其中一个槽,进而决定key-value存储到哪个节点中。所以一旦某个节点挂了,该节点对应的slot就无法使用,那么就会导致集群无法正常工作。

  • ​ 综上所述,每个Redis集群理论上最多可以有16384个节点。

​   b:如果进群超过半数以上master挂掉,无论是否有slave集群进入fail状态.

(3) Redis集群至少需要3个节点,因为投票容错机制要求超过半数节点认为某个节点挂了该节点才是挂了,所以2个节点无法构成集群。

要保证集群的高可用,需要每个节点都有从节点,也就是备份节点,所以Redis集群至少需要6台服务器。因为我没有那么多服务器,也启动不了那么多虚拟机,所在这里搭建的是伪分布式集群,即一台服务器虚拟运行6个redis实例,修改端口号为(7000-7005),当然实际生产环境的Redis集群搭建和这里是一样的。

二、redis cluster安装

1、下载

[root@localhost ~]# cd /usr/local/
[root@localhost local]# wget http://download.redis.io/releases/redis-3.2.1.tar.gz
[root@localhost local]# tar -zxvf redis-3.2.1.tar.gz

2、 编译安装

[root@localhost local]# cd redis-3.2.1
[root@localhost redis-3.2.1]# make 

3、创建redis节点

测试我们选择2台服务器,分别为:192.168.11.11,192.168.11.12每个服务器有3个节点。

我先在192.168.11.11创建3个节点:

 [root@localhostredis-3.2.1]# cd /usr/local/
 [root@localhost local]# mkdir redis_cluster         //创建集群目录
 [root@localhost local]# cd redis_cluster
 [root@localhost redis_cluster]# mkdir 7000 7001 7002  //分别代表三个节点    
 其对应端口 7000 7001 7002
 //创建7000节点为例,拷贝到7000目录
 [root@localhost redis_cluster]# cp /usr/local/redis-3.2.1/redis.conf  ./7000/   
 //拷贝到7001目录
 [root@localhost redis_cluster]# cp /usr/local/redis-3.2.1/redis.conf  ./7001/   
 //拷贝到7002目录
 [root@localhost redis_cluster]# cp /usr/local/redis-3.2.1/redis.conf  ./7002/ 
 [root@localhost redis_cluster]# vim ./7000/redis.conf
 
daemonize    yes                          //redis后台运行
pidfile  /var/run/redis_7000.pid          //pidfile文件对应7000,7002,7003
port  7000                                //端口7000,7002,7003
cluster-enabled  yes                      //开启集群  把注释#去掉
cluster-config-file  nodes_7000.conf      //集群的配置  配置文件首次启动自动生成 7000,7001,7002
cluster-node-timeout  5000                //请求超时  设置5秒够了
appendonly  yes                           //aof日志开启  有需要就开启,它会每次写操作都记录一条日志



同理:在192.168.11.12创建3个节点:对应的端口改为7003,7004,7005.配置对应的改一下就可以了。

4、两台机启动各节点(两台服务器方式一样)

[root@localhost redis_cluster]# cd /usr/local
[root@localhost local]# redis-server  ./redis_cluster/7000/redis.conf
[root@localhost local]# redis-server  ./redis_cluster/7001/redis.conf
[root@localhost local]# redis-server  ./redis_cluster/7002/redis.conf
[root@localhost local]# redis-server  ./redis_cluster/7003/redis.conf
[root@localhost local]# redis-server  ./redis_cluster/7004/redis.conf
[root@localhost local]# redis-server  ./redis_cluster/7005/redis.conf

5、查看服务

​ ps -ef | grep redis #查看是否启动成功

三、创建集群

前面已经准备好了搭建集群的redis节点,接下来我们要把这些节点都串连起来搭建集群。官方提供了一个工具:redis-trib.rb(/usr/local/redis-3.2.1/src/redis-trib.rb) 看后缀就知道这鸟东西不能直接执行,它是用ruby写的一个程序,所以我们还得安装ruby.

[root@localhost local]# yum -y install ruby ruby-devel rubygems rpm-build 

再用 gem 这个命令来安装 redis接口 gem是ruby的一个工具包.

gem install redis    
当然,方便操作,两台Server都要安装。

如果提示以下错误

[root@localhost local]# gem install redis
ERROR:  Error installing redis:
 redis requires Ruby version >= 2.2.2.

CentOS7 yum库中ruby的版本支持到 2.0.0,可gem 安装redis需要最低是2.2.2,采用rvm来更新ruby:

1、安装 RVM

[root@localhost local]# gpg --keyserver hkp://keys.gnupg.net --recv-keys 409B6B1796C275462A1703113804BB82D39DC0E3 7D2BAF1CF37B13E2069D6956105BD0E739499BDB 
[root@localhost local]# curl -sSL https://get.rvm.io | bash -s stable
[root@localhost local]# find / -name rvm -print

                /usr/local/rvm
             /usr/local/rvm/src/rvm
             /usr/local/rvm/src/rvm/bin/rvm
             /usr/local/rvm/src/rvm/lib/rvm
             /usr/local/rvm/src/rvm/scripts/rvm
             /usr/local/rvm/bin/rvm
             /usr/local/rvm/lib/rvm
             /usr/local/rvm/scripts/rvm
             
[root@localhost local]# source /usr/local/rvm/scripts/rvm

2、查看rvm库中已知的ruby版本:

 [root@localhost local]# rvm list known

MRI Rubies     [ruby-]1.8.6[-p420]     [ruby-]1.8.7[-head] # security released on head     [ruby-]1.9.1[-p431]     [ruby-]1.9.2[-p330]     [ruby-]1.9.3[-p551]     [ruby-]2.0.0[-p648]     [ruby-]2.1[.10]     [ruby-]2.2[.7]     [ruby-]2.3[.4]     [ruby-]2.4[.1]     ruby-head     ….

3、安装一个ruby版本:

 [root@localhost local]# rvm install 2.4.1

Searching for binary rubies, this might take some time.     Found remote file https://rvm_io.global.ssl.fastly.net/binaries/centos/7/x86_64/ruby-2.4.1.tar.bz2     Checking requirements for centos.     Requirements installation successful.     ruby-2.4.1 - #configure     ruby-2.4.1 - #download      % Total % Received % Xferd Average Speed Time Time Time Current      Dload Upload Total Spent Left Speed     100 14.1M 100 14.1M 0 0 97k 0 0:02:27 0:02:27 --:--:-- 159k     No checksum for downloaded archive, recording checksum in user configuration.     ruby-2.4.1 - #validate archive     ruby-2.4.1 - #extract     ruby-2.4.1 - #validate binary     ruby-2.4.1 - #setup     ruby-2.4.1 - #gemset created /usr/local/rvm/gems/ruby-2.4.1@global     ruby-2.4.1 - #importing gemset /usr/local/rvm/gemsets/global.gems..............................     ruby-2.4.1 - #generating global wrappers........     ruby-2.4.1 - #gemset created /usr/local/rvm/gems/ruby-2.4.1     ruby-2.4.1 - #importing gemsetfile /usr/local/rvm/gemsets/default.gems evaluated to empty gem list     ruby-2.4.1 - #generating default wrappers........

4、使用一个ruby版本:

 [root@localhost local]# rvm use 2.4.1

5、设置默认版本:

(设置ruby2.4.1为默认的ruby,因为还安装有1.8.3)

 [root@localhost local]# rvm use 2.4.1 --default

6、卸载一个已知版本:

 [root@localhost local]# rvm remove 2.3.4

7、查看ruby版本:

 [root@localhost local]# ruby --version

8、安装redis:

[root@localhost local]# gem install redis

Fetching: redis-4.0.1.gem (100%)     Successfully installed redis-4.0.1     Parsing documentation for redis-4.0.1     Installing ri documentation for redis-4.0.1     Done installing documentation for redis after 3 seconds     1 gem installed

上面的步骤完事了,接下来运行一下redis-trib.rb

[root@localhost local]# /usr/local/redis-3.2.1/src/redis-trib.rb

Usage: redis-trib <command> <options> <arguments ...>

   reshard        host:port
                  --to <arg>
                  --yes
                  --slots <arg>
                  --from <arg>
  check          host:port
  call            host:port command arg arg .. arg
  set-timeout    host:port milliseconds
  add-node        new_host:new_port existing_host:existing_port
                  --master-id <arg>
                  --slave
  del-node        host:port node_id
  fix            host:port
  import          host:port
                  --from <arg>
  help            (show this help)
  create          host1:port1 ... hostN:portN
                  --replicas <arg>

For check, fix, reshard, del-node, set-timeout you can specify the host and port of any working node in the cluster.

看到这,应该明白了吧, 就是靠上面这些操作 完成redis集群搭建的.

确认所有的节点都启动,接下来使用参数create 创建 (在192.168.11.11中来创建)

解释下, --replicas 1 表示 自动为每一个master节点分配一个slave节点 上面有6个节点,程序会按照一定规则生成 3个master(主)3个slave(从)

​ 前面已经提醒过的 防火墙一定要开放监听的端口,否则会创建失败。

运行中,提示Can I set the above configuration? (type 'yes' to accept): yes //输入yes 如果提示 Sending Cluster Meet Message to join the Cluster. Waiting for the cluster to join..........
​ 在192.168.11.12, redis-cli -c -p 7003 分别进入redis各节点的客户端命令窗口, 依次输入 cluster meet 192.168.11.12 7003……

​ 回到Server1,已经创建完毕了。

​ 查看一下

[root@localhost local]# /usr/local/redis/src/redis-trib.rb check 192.168.11.11:7000

​ 到这里集群已经初步搭建好了。

四、测试

1)get 和 set数据

[root@localhost local]# redis-cli -c -p 7000

​ 进入命令窗口,直接 set hello howareyou 然后可以去别的节点 get hello 查看下

​ 直接根据hash匹配切换到相应的slot的节点上。

​ 还是要说明一下,redis集群有16383个slot组成,通过分片分布到多个节点上,读写都发生在master节点。

2)假设测试

​ 先把192.168.11.12的服务Down掉,(192.168.11.12有1个Master, 2个Slave) , 切到192.168.11.11, 查看一下 ,192.168.11.11的3个节点全部都是Master,其他几个Server2的不见了

​ 测试一下,依然没有问题,集群依然能继续工作。

​ 原因: redis集群 通过选举方式进行容错,保证一台Server挂了还能跑,这个选举是全部集群超过半数以上的Master发现其他Master挂了后,会将其他对应的Slave节点升级成Master.

​ 疑问: 要是挂的是192.168.11.11怎么办? 毫无疑问,cluster is down!! 没办法,超过半数挂了那救不了了,整个集群就无法工作了。 要是有三台Server,每台两Master,切记对应的主从节点不要放在一台Server,别问我为什么自己用脑子想想看,互相交叉配置主从,挂哪台也没事,但是如果同时两台crash了,凉凉~