Dubbo负载均衡、容错、高可用

转载

灰色程序 2021-08-04 14:54:01

文章标签 zookeeper 服务器 spring 提供方 xml 文章分类 负载均衡服务器

Dubbo负载均衡、容错、高可用_xml

Random LoadBalance(默认) 随机，按权重设置随机概率。
在一个截面上碰撞的概率高，但调用量越大分布越均匀，而且按概率使用权重后也比较均匀，有利于动态调整提供者权重。
RoundRobin LoadBalance 轮询，按公约后的权重设置轮询比率。
存在慢的提供者累积请求的问题，比如：第二台机器很慢，但没挂，当请求调到第二台时就卡在那，久而久之，所有请求都卡在调到第二台上。
LeastActive LoadBalance 最少活跃调用数，相同活跃数的随机，活跃数指调用前后计数差。
使慢的提供者收到更少请求，因为越慢的提供者的调用前后计数差会越大。
ConsistentHash LoadBalance 一致性 Hash，相同参数的请求总是发到同一提供者。
当某一台提供者挂时，原本发往该提供者的请求，基于虚拟节点，平摊到其它提供者，不会引起剧烈变动。缺省只对第一个参数 Hash，如果要修改，请配置缺省用 160 份虚拟节点，如果要修改，请配置

1.2配置

1.2.1xml方式

可以在提供方配置也可以在消费方配置. 有如下几种,任选一种

服务端服务级别

<dubbo:service interface="..." loadbalance="roundrobin" />

服务端方法级别

<dubbo:service interface="..."> 
<dubbo:method name="..." loadbalance="roundrobin"/> 
</dubbo:service>

客户端服务级别

<dubbo:reference interface="..." loadbalance="roundrobin" />

客户端方法级别

<dubbo:reference interface="...">
<dubbo:method name="..." loadbalance="roundrobin"/> 
</dubbo:reference>

1.2.2注解方式

提供者配置

@Service(loadbalance = "")
public class UserServiceImpl implements UserService {}

消费者配置,通过loadbalance属性

@Reference(loadbalance = "roundrobin ") 
private UserService userService;

2.集群容错

2.1集群中容错类型

在集群调用失败时，Dubbo 提供了多种容错方案，缺省为 failover 重试。

Dubbo负载均衡、容错、高可用_xml_02

2.2Dubbo中容错策略

Failover Cluster

失败自动切换，当出现失败，重试其它服务器. 通常用于读操作，但重试会带来更长延迟。可通过 retries="2" 来设置重试次数(不含第一次)。可以在提供方配置也可以在消费方配置

//提供方配置
<dubbo:service retries="2" />
//消费方配置
<dubbo:reference retries="2" />

Failfast Cluster
快速失败，只发起一次调用，失败立即报错。通常用于非幂等性的写操作，比如新增记录。
Failsafe Cluster
失败安全，出现异常时，直接忽略。通常用于写入审计日志等操作。
Failback Cluster
失败自动恢复，后台记录失败请求，定时重发。通常用于消息通知操作。
Forking Cluster
并行调用多个服务器，只要一个成功即返回。通常用于实时性要求较高的读操作，但需要浪费更多服务资源。可通过 forks="2" 来设置最大并行数。
Broadcast Cluster
广播调用所有提供者，逐个调用，任意一台报错则报错 [2]。通常用于通知所有提供者更新缓存或日志等本地资源信息。

2.3配置

2.3.1xml方式

服务提供方

<dubbo:service cluster="failsafe" />

服务消费方

<dubbo:reference cluster="failsafe" />

2.3.2注解方式

服务提供方

@Service(cluster = "failsafe")

服务消费方

@Reference(cluster = "failsafe")

3.SpringBoot整合熔断器Hystrix

3.1Hystrix概述

Hystrix是一个用于处理分布式系统的延迟和容错的开源库，Hystrix 能使你的系统在出现依赖服务失效的时候，通过隔离系统所依赖的服务，防止服务级联失败，同时提供失败回退机制，更优雅地应对失效，并使你的系统能更快地从异常中恢复 .

“断路器”本身是一种开关装置，当某个服务单元发生故障之后，通过断路器的故障监控（类似熔断保险丝），向调用方返回一个符合预期的、可处理的备选响应（FallBack），而不是长时间的等待或者抛出调用方无法处理的异常，这样就保证了服务调用方的线程不会被长时间、不必要地占用，从而避免了故障在分布式系统中的蔓延，乃至雪崩。

Dubbo负载均衡、容错、高可用_服务器_03

3.2整合Hystrix进行容错

3.2.1提供方

在pom.xml添加Hystrix起步依赖

<dependency> 
<groupId>org.springframework.cloud</groupId>
<artifactId>spring‐cloud‐starter‐netflix‐hystrix</artifactId> 
</dependency> 
<dependencyManagement>
<dependencies>
<dependency>
<groupId>org.springframework.cloud</groupId> 
<artifactId>spring‐cloud‐dependencies</artifactId> 
<version>Finchley.SR1</version>
<type>pom</type>
<scope>import</scope>
</dependency>
</dependencies>
</dependencyManagement>

在启动类上面开启Hystrix(@EnableHystrix )

@EnableHystrix 
@EnableDubbo
@SpringBootApplication 
public class UserApplication {
public static void main(String[] args) {
SpringApplication.run(UserApplication.class,args);
  }
}

在提供的方法上面添加注解@HystrixCommand

@Service
public class UserServiceImpl implements UserService {
/**
  * 按照用户id返回所有的收货地址
  * @param userId
  * @return 
  */ @HystrixCommand
public List<Address> findUserAddressList(String userId) {
//模拟dao查询数据库
    System.out.println("UserServiceImpl....");
List<Address> list = new ArrayList<Address>();
list.add(new Address(1,"北京","1","张三","12306"));
list.add(new Address(2,"武汉","2","李四","18170"));
return list;
   }
}

3.2.2消费者

在pom.xml添加Hystrix起步依赖

<dependency>
<groupId>org.springframework.cloud</groupId> 
<artifactId>spring‐cloud‐starter‐netflix‐hystrix</artifactId>
</dependency>
<dependencyManagement>
<dependencies> 
<dependency> 
<groupId>org.springframework.cloud</groupId> 
<artifactId>spring‐cloud‐dependencies</artifactId>
<version>Finchley.SR1</version> 
<type>pom</type> 
<scope>import</scope>
</dependency> 
</dependencies> 
</dependencyManagement>

在启动类上面开启Hystrix(@EnableHystrix )

@EnableHystrix
@EnableDubbo 
@SpringBootApplication 
public class OrderApplication {
public static void main(String[] args) {
SpringApplication.run(OrderApplication.class,args);
  }
}

在调用的方法上面添加注解@HystrixCommand

@RestController 
@RequestMapping("/order")
public class OrderController {
@Reference(cluster = "") private UserService userService;
@HystrixCommand(fallbackMethod = "nativeMethod") 
@RequestMapping("/save") 
public List<Address> save(){
    List<Address> list = userService.findUserAddressList("1");
    System.out.println(list);
//调用业务...
return list;
  }
//当远程方法调用失败,会触发当前方法
public List<Address> nativeMethod(){
    List<Address> list = new ArrayList<Address>();
    list.add(new Address(1,"默认地址","1","默认收货人","默认电话"));
return list;
  }
}

4.Zookeeper集群

4.1.Zookeeper集群简介

4.1.1为什么搭建Zookeeper集群

大部分分布式应用需要一个主控、协调器或者控制器来管理物理分布的子进程。目前，大多数都要开发私有的协调程序，缺乏一个通用机制，协调程序的反复编写浪费，且难以形成通用、伸缩性好的协调器，zookeeper提供通用的分布式锁服务，用以协调分布式应用。所以说zookeeper是分布式应用的协作服务。

zookeeper作为注册中心，服务器和客户端都要访问，如果有大量的并发，肯定会有等待。所以可以通过 zookeeper集群解决。

下面是zookeeper集群部署结构图：

Dubbo负载均衡、容错、高可用_xml_04

4.1.2Leader选举

Zookeeper的启动过程中leader选举是非常重要而且最复杂的一个环节。那么什么是leader选举呢？zookeeper为什么需要leader选举呢？zookeeper的leader选举的过程又是什么样子的？

看什么是leader选举。其实这个很好理解，leader选举就像总统选举一样，每人一票，获得多数票的人就当选为总统了。在zookeeper集群中也是一样，每个节点都会投票，如果某个节点获得超过半数以上的节点的投票，则该节点就是leader节点了。

4.2搭建Zookeeper集群

4.2.1搭建要求

真实的集群是需要部署在不同的服务器上的，但是在我们测试时同时启动十几个虚拟机内存会吃不消，所以我们通常会搭建伪集群，也就是把所有的服务都搭建在一台虚拟机上，用端口进行区分。

搭建一个三个节点的Zookeeper集群（伪集群）。

4.2.2准备工作

（1）安装JDK 【步骤略】。

（2）Zookeeper压缩包上传到服务器【也可用docker方式】

（3）将Zookeeper解压，创建data目录，将 conf下zoo_sample.cfg 文件改名为 zoo.cfg

（4）建立/usr/local/zookeeper-cluster目录，将解压后的Zookeeper复制到以下三个目录

/usr/local/zookeeper-cluster/zookeeper-1

/usr/local/zookeeper-cluster/zookeeper-2

/usr/local/zookeeper-cluster/zookeeper-3

[root@localhost ~]# mkdir /usr/local/zookeeper‐cluster
[root@localhost ~]# cp ‐r zookeeper‐3.4.6 /usr/local/zookeeper‐cluster/zookeeper‐1
[root@localhost ~]# cp ‐r zookeeper‐3.4.6 /usr/local/zookeeper‐cluster/zookeeper‐2
[root@localhost ~]# cp ‐r zookeeper‐3.4.6 /usr/local/zookeeper‐cluster/zookeeper‐3

（5）配置每一个Zookeeper 的dataDir（zoo.cfg） clientPort 分别为2181 2182 2183

修改/usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg

clientPort=2181
dataDir=/usr/local/zookeeper‐cluster/zookeeper‐1/data

修改/usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg

clientPort=2182
dataDir=/usr/local/zookeeper‐cluster/zookeeper‐2/data

修改/usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

clientPort=2183
dataDir=/usr/local/zookeeper‐cluster/zookeeper‐3/data

4.2.3配置集群

（1）在每个zookeeper的 data 目录下创建一个 myid 文件，内容分别是1、2、3 。这个文件就是记录每个服务器的ID

‐‐‐‐‐‐‐知识点小贴士‐‐‐‐‐‐
如果你要创建的文本文件内容比较简单，我们可以通过echo 命令快速创建文件
格式为：
echo 内容 >文件名
例如我们为第一个zookeeper指定ID为1，则输入命令

Dubbo负载均衡、容错、高可用_xml_05

（2）在每一个zookeeper 的 zoo.cfg配置客户端访问端口（clientPort）和集群服务器IP列表。

集群服务器IP列表如下

server.1=192.168.25.140:2881:3881
server.2=192.168.25.140:2882:3882
server.3=192.168.25.140:2883:3883

解释：server.服务器ID=服务器IP地址：服务器之间通信端口：服务器之间投票选举端口

4.2.4启动集群

(1)启动集群就是分别启动每个实例

Dubbo负载均衡、容错、高可用_服务器_06

(2)启动后我们查询一下每个实例的运行状态

先查询第一个服务, Mode为follower表示是跟随者（从）

Dubbo负载均衡、容错、高可用_提供方_07

再查询第二个服务Mod 为leader表示是领导者（主）

Dubbo负载均衡、容错、高可用_spring_08

查询第三个为跟随者（从）

Dubbo负载均衡、容错、高可用_服务器_09

4.2.5模拟集群异常

（1）首先我们先测试如果是从服务器挂掉，会怎么样

把3号服务器停掉，观察1号和2号，发现状态并没有变化

Dubbo负载均衡、容错、高可用_xml_10

由此得出结论，3个节点的集群，从服务器挂掉，集群正常

（2）我们再把1号服务器（从服务器）也停掉，查看2号（主服务器）的状态，发现已经停止运行了。

Dubbo负载均衡、容错、高可用_xml_11

由此得出结论，3个节点的集群，2个从服务器都挂掉，主服务器也无法运行。因为可运行的机器没有超过集群总数量的半数。

（3）我们再次把1号服务器启动起来，发现2号服务器又开始正常工作了。而且依然是领导者。

Dubbo负载均衡、容错、高可用_spring_12

（4）我们把3号服务器也启动起来，把2号服务器停掉（汗~~干嘛？领导挂了？）停掉后观察1号和3号的状态。

Dubbo负载均衡、容错、高可用_spring_13

发现新的leader产生了~

由此我们得出结论，当集群中的主服务器挂了，集群中的其他服务器会自动进行选举状态，然后产生新得leader

（5）我们再次测试，当我们把2号服务器重新启动起来（汗~~这是诈尸啊!）启动后，会发生什么？2号服务器会再次成为新的领导吗？我们看结果

Dubbo负载均衡、容错、高可用_提供方_14

我们会发现，2号服务器启动后依然是跟随者（从服务器），3号服务器依然是领导者（主服务器），没有撼动3号服务器的领导地位。

由此我们得出结论，当领导者产生后，再次有新服务器加入集群，不会影响到现任领导者。

4.3.Dubbo连接zookeeper集群

修改服务提供者和服务调用者的spring 配置文件

<!‐‐ 指定注册中心地址 ‐‐> 
<dubbo:registry protocol="zookeeper" address="192.168.25.140:2181,192.168.25.140:2182,192.168.25.140:2183">
</dubbo:registry>

Dubbo负载均衡、容错、高可用_zookeeper_15

上一篇：2017年美团Java程序员开发，看我如何拿到offer

下一篇：网站高并发大流量访问的处理及解决方法

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯