1、分布式系统定义

Dubbo是用于分布式系统的框架所以我们要先了解什么是分布式,分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统。

老式系统(单一应用架构)是把一个系统,统一放到一个服务器当中然后每一个服务器上放一个系统,如果要更新代码的话,每一个服务器上的系统都要重新部署,十分麻烦。

而分布式系统就是将一个完整的系统拆分成多个不同的服务,然后在将每一个服务单独的放到一个服务器当中

应用的架构演变

docket 部署dubbo分布式 dubbo如何实现分布式_服务器


单一应用架构:一个项目装到一个服务器当中,也可以运行多个服务器每一个服务器当中都装一个项目。

缺点:1.如果要添加某一个功能的话就要把一个项目重新打包,在分别部署到每一个服务器当中去。2.如果后期项目越来越大的话单台服务器跑一个项目压力会很大的。会不利于维护,开发和程序的性能。

垂直应用架构:将一个应用拆成几个小应用,每个小应用都是完整的从页面到业务逻辑到数据库,再将每个小应用独立放到一个服务器上,如果哪一个应用的访问数量多就多加几台服务器。这样做的好处:1.分工合作很容易2.性能扩展很容易
缺点:1.界面和应用逻辑之间没有分离(界面修改频繁,每修改一次都要重新部署)2.小应用不可能完全独立,大量的应用之间需要交互

分布式服务架构

docket 部署dubbo分布式 dubbo如何实现分布式_dubbo_02


当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。此时,用于提高业务复用及整合的分布式服务框架(RPC)是关键流动计算框架

docket 部署dubbo分布式 dubbo如何实现分布式_dubbo_03

当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于访问压力实时管理集群容量,提高集群利用率。此时,用于提高机器利用率的资源调度和治理中心(SOA)[ Service Oriented Architecture]是关键。

RPC简介

RPC【Remote Procedure Call】是指远程过程调用,是一种进程间通信方式,它是一种技术的思想,而不是规范。它允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的过程或函数,而不用程序员显式编码这个远程调用的细节。即程序员无论是调用本地的还是远程的函数,本质上编写的调用代码基本相同。

RPC基本原理

docket 部署dubbo分布式 dubbo如何实现分布式_服务器_04

RPC步骤解析

docket 部署dubbo分布式 dubbo如何实现分布式_dubbo_05

  1. Client像调用本地服务似的调用远程服务;
  2. Client stub接收到调用后,将方法、参数序列化
  3. 客户端通过sockets将消息发送到服务端
  4. Server stub 收到消息后进行解码(将消息对象反序列化)
  5. Server stub 根据解码结果调用本地的服务
  6. 本地服务执行(对于服务端来说是本地执行)并将结果返回给Server stub
  7. Server stub将返回结果打包成消息(将结果消息对象序列化)
  8. 服务端通过sockets将消息发送到客户端
  9. Client stub接收到结果消息
  10. 进行解码(将结果消息发序列化)
  11. 客户端得到最终结果。

2、dubbo核心概念

2.1、简介

Apache Dubbo (incubating) |ˈdʌbəʊ| 是一款高性能、轻量级的开源Java RPC框架,它提供了三大核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现。

Dubbo官网 2.2、基本概念

docket 部署dubbo分布式 dubbo如何实现分布式_spring_06


服务提供者(Provider):暴露服务的服务提供方,服务提供者在启动时,向注册中心注册自己提供的服务。

服务消费者(Consumer): 调用远程服务的服务消费方,服务消费者在启动时,向注册中心订阅自己所需的服务,服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。

注册中心(Registry):注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者

监控中心(Monitor):服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心

3、dubbo环境搭建

3.1、安装zookeeper

  • 下载zookeeper并解压(解压运行zkServer.cmd ,初次运行会报错,是因为conf目录下没有zoo.cfg配置文件
  • 修改zoo.cfg配置文件(将conf下的zoo_sample.cfg复制一份改名为zoo.cfg即可
    注意几个重要位置:
    dataDir=./ 临时数据存储的目录(可写相对路径)
    clientPort=2181 zookeeper的端口号
    修改完成后再次启动zookeeper
    3.2、安装dubbo-admin管理控制台
    dubbo本身并不是一个服务软件。它其实是一个jar包能够帮助java程序连接到zookeeper,并利用zookeeper消费、提供服务。为了让用户更好的管理监控众多的dubbo服务,官方提供了一个可视化的监控程序,不过这个监控即使不装也不影响使用。
  • 下载dubbo-admin
  • 打开目录下的“\dubbo-admin-server\src\main\resources”里的“application.properties”文件。然后把里面代码注释或者修改,使其中内容为如下代码所示,其中“server.port=7001”为设置端口,防止网络访问时发生端口冲突。其他两句都是默认值。
server.port = 7001
admin.registry.address=zookeeper://127.0.0.1:2181
admin.config-center=zookeeper://127.0.0.1:2181
  • 使用maven构建jar包。可以通过两种方式,命令行方式或者IDEA直接构建。构建后dubbo-admin及“dubbo-admin”开头的三个子文件夹下会分别产生target文件夹,包括构建出的文件。我们需要使用dubbo-admin-distribution文件夹下的target文件夹中的“dubbo-admin-0.3.0.jar”。
    注意,这个文件没有在主目录的target文件夹中,而是在子目录dubbo-admin-distribution下的target文件夹中
    (1)命令行方式:“Ctrl+R”输入“cmd”。进入dubbo-admin安装目录,然后输入下面代码
mvn clean package

报错的话,也可以使用这个命令打包

mvn clean package -Dmaven.test.skip=true

进入“/dubbo-admin-distribution/target”文件夹并启动生成的jar包。注意语句中的jar包名称,应与所生成的文件名称一致,请自行查看文件夹。

java -jar dubbo-admin-0.3.0.jar

docket 部署dubbo分布式 dubbo如何实现分布式_ide_07


启动成功后在浏览器输入“http://localhost:7001”打开界面,默认使用root/root 登陆

4.DUBBO的使用

导入依赖->服务提供者,消费者配置application.yml(指定注册中心)->启动类添加注解

docket 部署dubbo分布式 dubbo如何实现分布式_ide_08


5.Dubbo配置

(1)、配置原则

JVM 启动 -D 参数优先,这样可以使用户在部署和启动时进行参数重写,比如在启动时需改变协议的端口。

XML次之,如果在 XML中有配置,则dubbo.properties中的相应配置项无效。

Properties 最后,相当于缺省值,只有 XML 没有配置时,dubbo.properties 的相应配置项才会生效,通常用于共享公共配置,比如应用名。

(2)、重试次数

失败自动切换,当出现失败,重试其它服务器,但重试会带来更长延迟。可通过 retries=“2” 来设置重试次数(不含第一次)。

重试次数配置如下:

<dubbo:service retries="2" />
或
<dubbo:reference retries="2" />
或
<dubbo:reference>
    <dubbo:method name="findFoo" retries="2" />
</dubbo:reference>

(3)、超时时间
由于网络或服务端不可靠,会导致调用出现一种不确定的中间状态(超时)。为了避免超时导致客户端资源(线程)挂起耗尽,必须设置超时时间。

  • Dubbo消费端
全局超时配置
<dubbo:consumer timeout="5000" />

指定接口以及特定方法超时配置
<dubbo:reference interface="com.foo.BarService" timeout="2000">
    <dubbo:method name="sayHello" timeout="3000" />
</dubbo:reference>
  • Dubbo服务端
全局超时配置
<dubbo:provider timeout="5000" />

指定接口以及特定方法超时配置
<dubbo:provider interface="com.foo.BarService" timeout="2000">
    <dubbo:method name="sayHello" timeout="3000" />
</dubbo:provider>
  • 配置原则
    dubbo推荐在Provider上尽量多配置Consumer端属性:
    1)、服务的提供者,比服务使用方更清楚服务性能参数,如调用的超时时间,合理的重试次数,等等
    2)、在Provider配置后,Consumer不配置则会使用Provider的配置值,即Provider配置可以作为Consumer的缺省值。否则,Consumer会使用Consumer端的全局设置,这对于Provider不可控的,并且往往是不合理的

配置的覆盖规则:

  1. 方法级配置别优于接口级别,即小Scope优先
  2. Consumer端配置优于 Provider配置优于全局配置

    6、版本号
    当一个接口实现,出现不兼容升级时,可以用版本号过渡,版本号不同的服务相互间不引用。
    可以按照以下的步骤进行版本迁移:
    在低压力时间段,先升级一半提供者为新版本
    再将所有消费者升级为新版本
    然后将剩下的一半提供者升级为新版本
老版本服务提供者配置:
<dubbo:service interface="com.foo.BarService" version="1.0.0" />

新版本服务提供者配置:
<dubbo:service interface="com.foo.BarService" version="2.0.0" />

老版本服务消费者配置:
<dubbo:reference id="barService" interface="com.foo.BarService" version="1.0.0" />

新版本服务消费者配置:
<dubbo:reference id="barService" interface="com.foo.BarService" version="2.0.0" />

如果不需要区分版本,可以按照以下的方式配置:
<dubbo:reference id="barService" interface="com.foo.BarService" version="*" />

7.高可用
(1)、zookeeper宕机与dubbo直连
现象:zookeeper注册中心宕机,还可以消费dubbo暴露的服务。
原因:健壮性

  • 监控中心宕掉不影响使用,只是丢失部分采样数据
  • 数据库宕掉后,注册中心仍能通过缓存提供服务列表查询,但不能注册新服务
  • 注册中心对等集群,任意一台宕掉后,将自动切换到另一台
  • 注册中心全部宕掉后,服务提供者和服务消费者仍能通过本地缓存通讯
  • 服务提供者无状态,任意一台宕掉后,不影响使用
  • 服务提供者全部宕掉后,服务消费者应用将无法使用,并无限次重连等待服务提供者恢复
    高可用:通过设计,减少系统不能提供服务的时间;

(2)、集群下dubbo负载均衡配置
在集群负载均衡时,Dubbo 提供了四种均衡策略,缺省为 random 随机调用。

  • Random LoadBalance随机,按权重设置随机概率。
    在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整提供者权重。
  • RoundRobin LoadBalance轮循,按公约后的权重设置轮循比率。
    存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。
  • LeastActive LoadBalance
    最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。
    使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。
  • ConsistentHash LoadBalance
    一致性 Hash,相同参数的请求总是发到同一提供者。
    当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。

配置负载均衡级别的方法:
可以给服务配置级别也可精确到每个方法的级别

服务端服务级别配置:
<dubbo:service interface="接口名" loadbalance="roundrobin"/>

服务端方法级别配置:
<dubbo:service interface="接口名">
  <dubbo:method name="方法名" loadbalance="均衡策略名"/>
</dubbo:service>

客户端服务级别配置:
<dubbo:reference interface="" loadbalance="roundrobin" />

客户端方法级别配置:
<dubbo:reference interface="" loadbalance="roundrobin">
    <dubbo:method name="方法名" loadbalance="均衡策略明"/>
</dubbo:reference>

(3)、整合hystrix,服务熔断与降级处理
1)、服务降级
什么是服务降级?
当服务器压力剧增的情况下,根据实际业务情况及流量,对一些服务和页面有策略的不处理或换种简单的方式处理,从而释放服务器资源以保证核心交易正常运作或高效运作。
可以通过服务降级功能临时屏蔽某个出错的非关键服务,并定义降级后的返回策略。
向注册中心写入动态配置覆盖规则:

RegistryFactory registryFactory = ExtensionLoader.getExtensionLoader(RegistryFactory.class).getAdaptiveExtension();
Registry registry = registryFactory.getRegistry(URL.valueOf("zookeeper://10.20.153.10:2181"));
registry.register(URL.valueOf("override://0.0.0.0/com.foo.BarService?category=configurators&dynamic=false&application=foo&mock=force:return+null"));

其中:

  • mock=force:return+null 表示消费方对该服务的方法调用都直接返回 null 值,不发起远程调用。用来屏蔽不重要服务不可用时对调用方的影响。
  • 还可以改为 mock=fail:return+null 表示消费方对该服务的方法调用在失败后,再返回 null 值,不抛异常。用来容忍不重要服务不稳定时对调用方的影响。

2)、集群容错
在集群调用失败时,Dubbo 提供了多种容错方案,缺省为 failover 重试。
集群容错模式

  • Failover Cluster
    失败自动切换,当出现失败,重试其它服务器。通常用于读操作,但重试会带来更长延迟。可通过 retries=“2” 来设置重试次数(不含第一次)。
重试次数配置如下:
<dubbo:service retries="2" />
或
<dubbo:reference retries="2" />
或
<dubbo:reference>
    <dubbo:method name="findFoo" retries="2" />
</dubbo:reference>
  • Failfast Cluster
    快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。
  • Failsafe Cluster
    失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。
  • Failback Cluster
    失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。
  • Forking Cluster
    并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks=“2” 来设置最大并行数。
  • Broadcast Cluster
    广播调用所有提供者,逐个调用,任意一台报错则报错 。通常用于通知所有提供者更新缓存或日志等本地资源信息。

集群模式配置
按照以下示例在服务提供方和消费方配置集群模式

<dubbo:service cluster="failsafe" />
或
<dubbo:reference cluster="failsafe" />

(4)、整合hystrix
Hystrix 旨在通过控制那些访问远程系统、服务和第三方库的节点,从而对延迟和故障提供更强大的容错能力。Hystrix具备拥有回退机制和断路器功能的线程和信号隔离,请求缓存和请求打包,以及监控和配置等功能
1)、配置spring-cloud-starter-netflix-hystrix
spring boot官方提供了对hystrix的集成,直接在pom.xml里加入依赖:

org.springframework.cloud
spring-cloud-starter-netflix-hystrix
1.4.4.RELEASE

然后在Application类上增加@EnableHystrix来启用hystrix starter:

@SpringBootApplication
@EnableHystrix
public class ProviderApplication {

2)、配置Provider端
在Dubbo的Provider上增加@HystrixCommand配置,这样子调用就会经过Hystrix代理。

@Service(version = "1.0.0")
public class HelloServiceImpl implements HelloService {
    @HystrixCommand(commandProperties = {
     @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold", value = "10"),//请求次数
     @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "2000") }) //时间范围
    @Override
    public String sayHello(String name) {
        throw new RuntimeException("Exception to show hystrix enabled.");
    }
    
}

那如果此时在调用生产的时候报错了怎办呢。不用担心,如果有报错,会在消费者端显现出来,为此我们只需要解决消费端就可以了。
3)、配置Consumer端
对于Consumer端,则可以增加一层method调用,并在method上配置@HystrixCommand。当调用出错时,会走到fallbackMethod = "reliable"的调用里。

@Reference(version = "1.0.0")
private HelloService demoService;

@HystrixCommand(fallbackMethod = "reliable")
public String doSayHello(String name) {
    return demoService.sayHello(name);
}
public String reliable(String name) {
    return "hystrix fallback value";
}