keepalived搭建nacos高可用集群

JDK 使用 jdk8
系统使用linux的Centos7.6版本(keepalived已经是系统基本的软件,业界广泛接受)

集群架构

官方给出的集群部署架构图

因此开源的时候推荐用户把所有服务列表放到一个vip下面,然后挂到一个域名下面

http://ip1:port/openAPI 直连ip模式,机器挂则需要修改ip才可以使用。

http://VIP:port/openAPI 挂载VIP模式,直连vip即可,下面挂server真实ip,可读性不好。

http://nacos.com:port/openAPI 域名 + VIP模式,可读性好,而且换ip方便,推荐模式

nacos集群的权重大小_nacos

为什么选择keepalived

VIP这里选择keepalived技术,在社区很多人使用nginx作为VIP,其实nginx并不适合做官方给出的VIP。
VIP是指的虚拟IP,当单点故障时VIP会自动的漂移到可用的节点,而nginx做的只是一个负载均衡和反向代理,虽然当nacos单点宕机时,nginx的反向代理也可以指向可用节点。但是如果nginx宕机呢 ? 因此nginx并不能完全做到nacos的高可用集群,因为往往nginx的高可用也是使用keepalived技术实现的。

下载安装包

默认机器上已经安装了jdk8+

可以去nacos github站点下载相应的安装包,安装包兼容性见:spring cloud alibaba版本说明 github nacos的tags地址:
https://github.com/alibaba/nacos/tags

配置

进入安装包下的conf目录修改 cluster.conf

添加类型如下配置:

200.8.9.16:8848
200.8.9.17:8848
200.8.9.18:8848

建议nacos集群不要少于3个,集群配置文件格式为ip:port,没行一个主机

配置Mysql数据库

nacos 已经搭建了高可以,但是数据库没有搭建高可用,也可以使用keepalived做mysql的高可用

配置实例见 : application.properties配置文件

初始化数据库sql文件见 :sql语句源文件

启动服务

sh startup.sh

关闭服务

sh shutdown.sh

配置keepalived虚拟IP(VIP)

keepalived配置

! Configuration File for keepalived

global_defs {
    router_id server142
}

    #监控服务nacos
    vrrp_script chk_nacos {
         script "/etc/keepalived/chk_nacos.sh"
         #每2s检查一次
         interval 2
         #每次检查-20
         weight -20
    }



vrrp_instance VI_1 {
       #只有一个MASTER 其他为BACKUP
        state MASTER
        #网卡
        interface eno3
        #必须一样
        virtual_router_id 60
        #优先级
        priority 120
        nopreempt
        advert_int 1
        authentication {
            auth_type PASS
            auth_pass 1111
        }
        track_script {
               #检测脚本,上面配置的
               chk_nacos
        }
        virtual_ipaddress {
            #虚拟ip  是同网关下未使用的ip
            172.16.1.120
        }
}

脚本表示每两秒钟进行一次Nacos服务检查,如果Nacos服务进程未启动,当前服务的权重-20,直到优先级低于从节点就会让出MASTER,VIP将漂移到其他节点,被漂移的节点升级为Master。

nacos服务检查脚本

chk_nacos.sh脚本文件内容:

#!/bin/bash
COUNT=$(ps -ef | grep nacos |grep -v "chk_nacos" | grep -v "grep" | wc -l )
echo "nacos服务数量为:$COUNT"
#判断nacos 是否都挂掉了
if [ $COUNT -lt 1 ]; then
   echo “nacos服务失败,让出master”
   exit 1
else
   echo "检测成功"
   exit 0
fi