Dubbo负载均衡、容错、高可用_xml

  • Random LoadBalance(默认) 随机,按权重设置随机概率。 
    在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整 提供者权重。

  • RoundRobin LoadBalance 轮询,按公约后的权重设置轮询比率。 
    存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久 之,所有请求都卡在调到第二台上。

  • LeastActive LoadBalance 最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。 
    使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。

  • ConsistentHash LoadBalance 一致性 Hash,相同参数的请求总是发到同一提供者。 
    当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。缺省只对第一个参数 Hash,如果要修改,请配置 缺省用 160 份虚拟节点,如果要修改,请配置

1.2配置

1.2.1xml方式

可以在提供方配置也可以在消费方配置. 有如下几种,任选一种

  • 服务端服务级别

<dubbo:service interface="..." loadbalance="roundrobin" />


  • 服务端方法级别

<dubbo:service interface="..."> 
<dubbo:method name="..." loadbalance="roundrobin"/> 
</dubbo:service>


  • 客户端服务级别

<dubbo:reference interface="..." loadbalance="roundrobin" />


  • 客户端方法级别

<dubbo:reference interface="...">
<dubbo:method name="..." loadbalance="roundrobin"/> 
</dubbo:reference>


1.2.2注解方式

  • 提供者配置

@Service(loadbalance = "")
public class UserServiceImpl implements UserService {}


  • 消费者配置,通过loadbalance属性

@Reference(loadbalance = "roundrobin ") 
private UserService userService;


2.集群容错

2.1集群中容错类型

在集群调用失败时,Dubbo 提供了多种容错方案,缺省为 failover 重试。

Dubbo负载均衡、容错、高可用_xml_02

2.2Dubbo中容错策略

  • Failover Cluster

    失败自动切换,当出现失败,重试其它服务器. 通常用于读操作,但重试会带来更长延迟。可通 过 retries="2" 来设置重试次数(不含第一次)。可以在提供方配置也可以在消费方配置

//提供方配置
<dubbo:service retries="2" />
//消费方配置
<dubbo:reference retries="2" />


  • Failfast Cluster 
    快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。

  • Failsafe Cluster 
    失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。

  • Failback Cluster 
    失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。

  • Forking Cluster 
    并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks="2" 来设置最大并行数。

  • Broadcast Cluster 
    广播调用所有提供者,逐个调用,任意一台报错则报错 [2]。通常用于通知所有提供者更新缓存或日志等本地 资源信息。

2.3配置

2.3.1xml方式

  • 服务提供方

<dubbo:service cluster="failsafe" />


  • 服务消费方

<dubbo:reference cluster="failsafe" />


2.3.2注解方式

  • 服务提供方

@Service(cluster = "failsafe")


  • 服务消费方

@Reference(cluster = "failsafe")


3.SpringBoot整合熔断器Hystrix

3.1Hystrix概述

Hystrix是一个用于处理分布式系统的延迟和容错的开源库,Hystrix 能使你的系统在出现依赖服务失效的时 候,通过隔离系统所依赖的服务,防止服务级联失败,同时提供失败回退机制,更优雅地应对失效,并使你的系统 能更快地从异常中恢复 .

“断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝), 向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的 异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃 至雪崩。

Dubbo负载均衡、容错、高可用_服务器_03

3.2整合Hystrix进行容错

3.2.1提供方

  • 在pom.xml添加Hystrix起步依赖

<dependency> 
<groupId>org.springframework.cloud</groupId>
<artifactId>spring‐cloud‐starter‐netflix‐hystrix</artifactId> 
</dependency> 
<dependencyManagement>
<dependencies>
<dependency>
<groupId>org.springframework.cloud</groupId> 
<artifactId>spring‐cloud‐dependencies</artifactId> 
<version>Finchley.SR1</version>
<type>pom</type>
<scope>import</scope>
</dependency>
</dependencies>
</dependencyManagement>


  • 在启动类上面开启Hystrix(@EnableHystrix )

@EnableHystrix 
@EnableDubbo
@SpringBootApplication 
public class UserApplication {
public static void main(String[] args) {
SpringApplication.run(UserApplication.class,args);
  }
}


  • 在提供的方法上面添加注解@HystrixCommand

@Service
public class UserServiceImpl implements UserService {
/**
  * 按照用户id返回所有的收货地址
  * @param userId
  * @return 
  */ @HystrixCommand
public List<Address> findUserAddressList(String userId) {
//模拟dao查询数据库
    System.out.println("UserServiceImpl....");
List<Address> list = new ArrayList<Address>();
list.add(new Address(1,"北京","1","张三","12306"));
list.add(new Address(2,"武汉","2","李四","18170"));
return list;
   }
}


3.2.2消费者

  • 在pom.xml添加Hystrix起步依赖

<dependency>
<groupId>org.springframework.cloud</groupId> 
<artifactId>spring‐cloud‐starter‐netflix‐hystrix</artifactId>
</dependency>
<dependencyManagement>
<dependencies> 
<dependency> 
<groupId>org.springframework.cloud</groupId> 
<artifactId>spring‐cloud‐dependencies</artifactId>
<version>Finchley.SR1</version> 
<type>pom</type> 
<scope>import</scope>
</dependency> 
</dependencies> 
</dependencyManagement>


  • 在启动类上面开启Hystrix(@EnableHystrix )

@EnableHystrix
@EnableDubbo 
@SpringBootApplication 
public class OrderApplication {
public static void main(String[] args) {
SpringApplication.run(OrderApplication.class,args);
  }
}


  • 在调用的方法上面添加注解@HystrixCommand

@RestController 
@RequestMapping("/order")
public class OrderController {
@Reference(cluster = "") private UserService userService;
@HystrixCommand(fallbackMethod = "nativeMethod") 
@RequestMapping("/save") 
public List<Address> save(){
    List<Address> list = userService.findUserAddressList("1");
    System.out.println(list);
//调用业务...
return list;
  }
//当远程方法调用失败,会触发当前方法
public List<Address> nativeMethod(){
    List<Address> list = new ArrayList<Address>();
    list.add(new Address(1,"默认地址","1","默认收货人","默认电话"));
return list;
  }
}


4.Zookeeper集群

4.1.Zookeeper集群简介

4.1.1为什么搭建Zookeeper集群

大部分分布式应用需要一个主控、协调器或者控制器来管理物理分布的子进程。目前,大多数都要开发私有的 协调程序,缺乏一个通用机制,协调程序的反复编写浪费,且难以形成通用、伸缩性好的协调器,zookeeper提供 通用的分布式锁服务,用以协调分布式应用。所以说zookeeper是分布式应用的协作服务。

zookeeper作为注册中心,服务器和客户端都要访问,如果有大量的并发,肯定会有等待。所以可以通过 zookeeper集群解决。

下面是zookeeper集群部署结构图:

Dubbo负载均衡、容错、高可用_xml_04

4.1.2Leader选举

Zookeeper的启动过程中leader选举是非常重要而且最复杂的一个环节。那么什么是leader选举呢?zookeeper为什么需要leader选举呢?zookeeper的leader选举的过程又是什么样子的?

看什么是leader选举。其实这个很好理解,leader选举就像总统选举一样,每人一票,获得多数票的 人就当选为总统了。在zookeeper集群中也是一样,每个节点都会投票,如果某个节点获得超过半数以上的节点的 投票,则该节点就是leader节点了。

4.2搭建Zookeeper集群

4.2.1搭建要求

真实的集群是需要部署在不同的服务器上的,但是在我们测试时同时启动十几个虚拟机内存会吃不消,所以我 们通常会搭建伪集群,也就是把所有的服务都搭建在一台虚拟机上,用端口进行区分。

搭建一个三个节点的Zookeeper集群(伪集群)。

4.2.2准备工作

(1)安装JDK 【步骤略】。

(2)Zookeeper压缩包上传到服务器【也可用docker方式】

(3)将Zookeeper解压,创建data目录 ,将 conf下zoo_sample.cfg 文件改名为 zoo.cfg

(4)建立/usr/local/zookeeper-cluster目录,将解压后的Zookeeper复制到以下三个目录

/usr/local/zookeeper-cluster/zookeeper-1

/usr/local/zookeeper-cluster/zookeeper-2

/usr/local/zookeeper-cluster/zookeeper-3

[root@localhost ~]# mkdir /usr/local/zookeeper‐cluster
[root@localhost ~]# cp ‐r zookeeper‐3.4.6 /usr/local/zookeeper‐cluster/zookeeper‐1
[root@localhost ~]# cp ‐r zookeeper‐3.4.6 /usr/local/zookeeper‐cluster/zookeeper‐2
[root@localhost ~]# cp ‐r zookeeper‐3.4.6 /usr/local/zookeeper‐cluster/zookeeper‐3


(5) 配置每一个Zookeeper 的dataDir(zoo.cfg) clientPort 分别为2181 2182 2183

  • 修改/usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg

clientPort=2181
dataDir=/usr/local/zookeeper‐cluster/zookeeper‐1/data


  • 修改/usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg

clientPort=2182
dataDir=/usr/local/zookeeper‐cluster/zookeeper‐2/data


  • 修改/usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

clientPort=2183
dataDir=/usr/local/zookeeper‐cluster/zookeeper‐3/data


4.2.3配置集群

(1)在每个zookeeper的 data 目录下创建一个 myid 文件,内容分别是1、2、3 。这个文件就是记录每个服务器 的ID

‐‐‐‐‐‐‐知识点小贴士‐‐‐‐‐‐
如果你要创建的文本文件内容比较简单,我们可以通过echo 命令快速创建文件
格式为:
echo 内容 >文件名
例如我们为第一个zookeeper指定ID为1,则输入命令

Dubbo负载均衡、容错、高可用_xml_05

(2)在每一个zookeeper 的 zoo.cfg配置客户端访问端口(clientPort)和集群服务器IP列表。

  • 集群服务器IP列表如下

server.1=192.168.25.140:2881:3881
server.2=192.168.25.140:2882:3882
server.3=192.168.25.140:2883:3883


解释:server.服务器ID=服务器IP地址:服务器之间通信端口:服务器之间投票选举端口

4.2.4启动集群

(1)启动集群就是分别启动每个实例

Dubbo负载均衡、容错、高可用_服务器_06

(2)启动后我们查询一下每个实例的运行状态

  • 先查询第一个服务, Mode为follower表示是跟随者(从)

Dubbo负载均衡、容错、高可用_提供方_07

  • 再查询第二个服务Mod 为leader表示是领导者(主)

Dubbo负载均衡、容错、高可用_spring_08

  • 查询第三个为跟随者(从)

Dubbo负载均衡、容错、高可用_服务器_09

4.2.5模拟集群异常

(1)首先我们先测试如果是从服务器挂掉,会怎么样

  • 把3号服务器停掉,观察1号和2号,发现状态并没有变化

Dubbo负载均衡、容错、高可用_xml_10

由此得出结论,3个节点的集群,从服务器挂掉,集群正常

(2)我们再把1号服务器(从服务器)也停掉,查看2号(主服务器)的状态,发现已经停止运行了。

Dubbo负载均衡、容错、高可用_xml_11

由此得出结论,3个节点的集群,2个从服务器都挂掉,主服务器也无法运行。因为可运行的机器没有超过集群总数 量的半数。

(3)我们再次把1号服务器启动起来,发现2号服务器又开始正常工作了。而且依然是领导者。

Dubbo负载均衡、容错、高可用_spring_12

(4)我们把3号服务器也启动起来,把2号服务器停掉(汗~~干嘛?领导挂了?)停掉后观察1号和3号的状态。

Dubbo负载均衡、容错、高可用_spring_13

发现新的leader产生了~

由此我们得出结论,当集群中的主服务器挂了,集群中的其他服务器会自动进行选举状态,然后产生新得leader

(5)我们再次测试,当我们把2号服务器重新启动起来(汗~~这是诈尸啊!)启动后,会发生什么?2号服务器会再 次成为新的领导吗?我们看结果

Dubbo负载均衡、容错、高可用_提供方_14

我们会发现,2号服务器启动后依然是跟随者(从服务器),3号服务器依然是领导者(主服务器),没有撼动3号 服务器的领导地位。

由此我们得出结论,当领导者产生后,再次有新服务器加入集群,不会影响到现任领导者。

4.3.Dubbo连接zookeeper集群

  • 修改服务提供者和服务调用者的spring 配置文件

<!‐‐ 指定注册中心地址 ‐‐> 
<dubbo:registry protocol="zookeeper" address="192.168.25.140:2181,192.168.25.140:2182,192.168.25.140:2183">
</dubbo:registry>

 

Dubbo负载均衡、容错、高可用_zookeeper_15