服务降级
- Hystrix熔断器
- 🔺 概述
- (1) 分布式系统面临的问题
- (2) 是什么
- (3) 能干嘛
- (4) 官网资料
- (5) Hystrix官宣,停更进维
- 🔺 HyStrix重要概念
- (1) 服务降级
- 产生的原因
- (2) 服务熔断
- (3) 服务限流
- 🔺 hystrix案例
- (1) 构建
- ① 新建模块 cloud-provider-hystrix-payment8001
- ② 配置 pom.xml
- ③ 配置 application.yml
- ④ 创建主启动类
- ⑤ Service:PaymentService
- ⑥ Controller:PaymentController
- ⑦ 测试
- (2) 高并发测试
- ① Jmeter压测测试
- ② Jmeter压测结论
- ③ 看热闹不嫌弃事大,80新建加入
- 新建模块 cloud-consumer-feign-hystrix-order80
- 配置 pom.xml
- 配置 application.yml
- 创建主启动类
- Service:PaymentHystrixService
- Controller:OrderHyrixController
- 正常测试
- 高并发测试
- (3) 故障和导致现象
- (4) 上述结论
- (5) 如何解决?解决的要求
- (6) 服务降级
- ① 降级配置
- ② 8001 先从自身找问题
- ③ 8001 fallback
- ④ 80 fallback
- 在 pom.xml 加入依赖:
- 在 application.yml 中加入配置:
- 在主启动类上加该注解
- 在 OrderHyrixController 中调整代码
- 测试
- ⑤ 目前问题
- ⑥ 解决办法
- 解决代码膨胀
- 解决业务逻辑混乱
- (7) 服务熔断
- ① 断路器
- ② 熔断是什么
- ③ 实操
- ④ 原理/小总结
- (8) 服务限流
- 🔺 hystrix工作流程
- 🔺 服务监控hystrixDashboard
- (1) 概述
- (2) 仪表盘9001
- ① 新建模块 cloud-consumer-hystrix-dashboard9001
- ② 配置 pom.xml
- ③ 配置 application.yml
- ④ 创建主启动类
- ⑤ 测试
- (3) 断路器演示(服务监控hystrixDashboard)
- ① 修改cloud-provider-hystrix-payment8001
- ② 监控测试
Hystrix熔断器
🔺 概述
(1) 分布式系统面临的问题
复杂分布式体系结构中的应用程序 有数10个依赖关系,每个依赖关系在某些时候将不可避免地失败
(2) 是什么
(3) 能干嘛
- 服务降级
- 服务熔断
- 接近实时的监控
(4) 官网资料
https://github.com/Netflix/hystrix/wiki
(5) Hystrix官宣,停更进维
- 被动修复bugs
- 不再接受合并请求
- 不再发布新版本
🔺 HyStrix重要概念
(1) 服务降级
服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示,fallback
产生的原因
- 程序运行异常
- 超时
- 服务熔断触发服务降级
- 线程池/信号量也会导致服务降级
(2) 服务熔断
类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示
服务的降级 -> 进而熔断 -> 恢复调用链路
(3) 服务限流
秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟N个,有序进行
🔺 hystrix案例
(1) 构建
① 新建模块 cloud-provider-hystrix-payment8001
② 配置 pom.xml
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<artifactId>cloud2020</artifactId>
<groupId>com.atguigu.springcloud</groupId>
<version>1.0-SNAPSHOT</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>cloud-provider-hystrix-payment8001</artifactId>
<dependencies>
<!--hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<!--eureka client-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-eureka-server</artifactId>
</dependency>
<dependency>
<groupId>com.atguigu.springcloud</groupId>
<artifactId>cloud-api-common</artifactId>
<version>${project.version}</version>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<!--监控-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<!--热部署-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-devtools</artifactId>
<scope>runtime</scope>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
</dependencies>
</project>
③ 配置 application.yml
server:
port: 8001
spring:
application:
name: cloud-provider-hystrix-payment
eureka:
client:
register-with-eureka: true
fetch-registry: true
service-url:
defaultZone: http://eureka7001.com:7001/eureka,http://eureka7002.com:7002/eureka
④ 创建主启动类
@SpringBootApplication
@EnableEurekaClient
public class PaymentHystrixMain8001 {
public static void main(String[] args) {
SpringApplication.run(PaymentHystrixMain8001.class, args);
}
}
⑤ Service:PaymentService
@Service
public class PaymentService {
// 正常访问
public String paymentInfo_OK(Integer id) {
return "线程池:" + Thread.currentThread().getName() + " paymentInfo_OK,id:" + id + "\t" + "O(∩_∩)O哈哈~";
}
// 超时访问
public String paymentInfo_TimeOut(Integer id) {
int timeNumber = 3;
try {
// 暂停3秒钟
TimeUnit.SECONDS.sleep(timeNumber);
} catch (InterruptedException e) {
e.printStackTrace();
}
return "线程池:" + Thread.currentThread().getName() + " paymentInfo_TimeOut,id:" + id + "\t" + "O(∩_∩)O哈哈~ 耗时(秒)" + timeNumber;
}
}
⑥ Controller:PaymentController
@RestController
@Slf4j
public class PaymentController {
@Resource
private PaymentService paymentService;
@GetMapping("/payment/hystrix/ok/{id}")
public String paymentInfo_OK(@PathVariable("id") Integer id) {
String result = paymentService.paymentInfo_OK(id);
log.info("**********result = " + result);
return result;
}
@GetMapping("/payment/hystrix/timeout/{id}")
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) {
String result = paymentService.paymentInfo_TimeOut(id);
log.info("*****result = " + result);
return result;
}
}
⑦ 测试
以上述为根基平台,从正确->错误->降级熔断->恢复
(2) 高并发测试
① Jmeter压测测试
② Jmeter压测结论
上面还只是服务提供者8001自己测试,假如此时外部的消费者80也来访问,那消费者只能干等,最终导致消费端80不满意,服务端8001直接被拖s
③ 看热闹不嫌弃事大,80新建加入
新建模块 cloud-consumer-feign-hystrix-order80
配置 pom.xml
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<artifactId>cloud2020</artifactId>
<groupId>com.atguigu.springcloud</groupId>
<version>1.0-SNAPSHOT</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>cloud-consumer-feign-hystrix-order80</artifactId>
<dependencies>
<!--openfeign-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-openfeign</artifactId>
</dependency>
<!--eureka client-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-eureka-server</artifactId>
</dependency>
<dependency>
<groupId>com.atguigu.springcloud</groupId>
<artifactId>cloud-api-common</artifactId>
<version>${project.version}</version>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<!--监控-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<!--热部署-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-devtools</artifactId>
<scope>runtime</scope>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
</dependencies>
</project>
配置 application.yml
server:
port: 80
eureka:
client:
register-with-eureka: false
fetch-registry: true
service-url:
defaultZone: http://eureka7001.com:7001/eureka,http://eureka7002.com:7002/eureka
创建主启动类
@SpringBootApplication
@EnableEurekaClient
@EnableFeignClients
public class OrderHystrixMain80 {
public static void main(String[] args) {
SpringApplication.run(OrderHystrixMain80.class, args);
}
}
Service:PaymentHystrixService
@Component
@FeignClient("CLOUD-PROVIDER-HYSTRIX-PAYMENT")
public interface PaymentHystrixService {
@GetMapping("/payment/hystrix/ok/{id}")
public String paymentInfo_OK(@PathVariable("id") Integer id) ;
@GetMapping("/payment/hystrix/timeout/{id}")
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) ;
}
Controller:OrderHyrixController
@RestController
@Slf4j
public class OrderHyrixController {
@Resource
private PaymentHystrixService paymentHystrixService;
@GetMapping("/payment/hystrix/ok/{id}")
public String paymentInfo_OK(@PathVariable("id") Integer id) {
return paymentHystrixService.paymentInfo_OK(id);
}
@GetMapping("/payment/hystrix/timeout/{id}")
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) {
return paymentHystrixService.paymentInfo_TimeOut(id);
}
}
正常测试
高并发测试
服务端自测 8001时 200x100 调用,客户端通过 feign也是 200x100,相当于2万个线程去并发访问 8001
(3) 故障和导致现象
8001同一层次的其他接口被困死,因为tomcat线程池里面的工作线程已经被挤占完毕
80此时调用8001,客户端访问响应缓慢,转圈圈
(4) 上述结论
正因为有上述故障或不佳表现 才有我们的降级/容错/限流等技术诞生
(5) 如何解决?解决的要求
- 超时导致服务器变慢(转圈) — 超时不再等待
- 出错(宕机或程序运行出错) — 出错要有兜底
解决
- 对方服务(8001)超时了,调用者(80)不能一直卡死等待,必须有服务降级
- 对方服务(8001)down机了,调用者(80)不能一直卡死等待,必须有服务降级
- 对方服务(8001)ok,调用者(80)自己有故障或有自我要求(自己的等待时间小于服务提供者)
(6) 服务降级
① 降级配置
@HystrixCommand
② 8001 先从自身找问题
设置自身调用超时时间的峰值,峰值内可以正常运行, 超过了需要有兜底的方法处理,做服务降级fallback
③ 8001 fallback
主启动类加上注解才能生效:@EnableCircuitBreaker
对业务类 PaymentService 做些修改
// 超时访问
@HystrixCommand(fallbackMethod = "payment_TimeOutHandler",commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds",value="3000")
})
public String paymentInfo_TimeOut(Integer id) {
int timeNumber = 13;
try {
// 暂停3秒钟
TimeUnit.SECONDS.sleep(timeNumber);
} catch (InterruptedException e) {
e.printStackTrace();
}
return "线程池:" + Thread.currentThread().getName() + " paymentInfo_TimeOut,id:" + id + "\t" + "O(∩_∩)O哈哈~ 耗时(秒)" + timeNumber;
}
// 兜底的方案,paymentInfo_TimeOut出现超时或者异常的时候就会调用这个方法
public String payment_TimeOutHandler(Integer id) {
return "/(ToT)/" + "调用支付接口超时或异常:\t" + "\t当前线程池名字" + Thread.currentThread().getName();
}
④ 80 fallback
在 pom.xml 加入依赖:
<!--hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
在 application.yml 中加入配置:
#开启 feign 的 hystrix支持,默认是false
#个人理解为通过feign访问服务时hystrix也有效,否则无效
feign:
hystrix:
enabled: true
在主启动类上加该注解
// 点开@EnableHystrix的源码可以看到@EnableCircuitBreaker注解在其上方
// 所以@EnableHystrix应该是@EnableCircuitBreaker的子注解
@EnableHystrix
在 OrderHyrixController 中调整代码
// 设置最大接收时间为1.5s,超时或遇到异常即调用兜底方法
@HystrixCommand(fallbackMethod = "paymentTimeOutFallbackMethod", commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "1500")
})
@GetMapping("/consumer/payment/hystrix/timeout/{id}")
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) {
return paymentHystrixService.paymentInfo_TimeOut(id);
}
// 客户端的兜底方法
// 经测试,参数和上面的方法必须保持一致,否则说找不到方法
public String paymentTimeOutFallbackMethod(@PathVariable("id") Integer id) {
return "我是消费者80,对方支付系统繁忙请10秒种后再试或者自己运行出错请检查自己,o(╥﹏╥)o";
}
测试
⑤ 目前问题
- 每个业务方法对应一个兜底的方法,代码膨胀
- 统一和自定义的分开
⑥ 解决办法
解决代码膨胀
对 8001 的 OrderHyrixController 进行调整
@DefaultProperties(defaultFallback = "payment_Global_FallbackMethod")
@GetMapping("/consumer/payment/hystrix/timeout/{id}")
// 测试统一的兜底方法,所以不指定兜底方法
@HystrixCommand
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) {
return paymentHystrixService.paymentInfo_TimeOut(id);
}
// 统一的兜底方法,若无单独设置兜底方法,则都访问该方方法
public String payment_Global_FallbackMethod() {
return "Global异常处理信息,请稍后重试.o(╥﹏╥)o";
}
解决业务逻辑混乱
本案例服务降级处理是在客户端80实现完成,与服务端8001没有关系 只需要为Feign客户端定义的接口添加一个服务降级处理的实现类即可实现解耦
未来我们要面对的异常
- 运行 runtime
- 超时 timelimit
- 宕机
根据cloud-consumer-feign-hystrix-order80已经有的PaymentHystrixService接口,重新新建一个类(PaymentFallbackService)实现接口,统一为接口里面的方法进行异常处理
@Service
public class PaymentFallbackService implements PaymentHystrixService {
@Override
public String paymentInfo_OK(Integer id) {
return "-----PaymentFallbackService fall back-paymentInfo_OK ,o(╥﹏╥)o";
}
@Override
public String paymentInfo_TimeOut(Integer id) {
return "-----PaymentFallbackService fall back-paymentInfo_TimeOut ,o(╥﹏╥)o";
}
}
@FeignClient(value = "CLOUD-PROVIDER-HYSTRIX-PAYMENT",fallback = PaymentFallbackService.class)
测试:
运行8001 和 80后先测试正常访问,然后挂掉 8001 再访问
此时服务端provider已经downl ,但是我们做了服务降级处理, 让客户端在服务端不可用时也会获得提示信息而不会挂起耗死服务器
(7) 服务熔断
① 断路器
一句话就是家里的保险丝
② 熔断是什么
③ 实操
PaymentService
//===服务熔断
@HystrixCommand(fallbackMethod = "paymentCircuitBreaker_fallback",commandProperties = {
@HystrixProperty(name = "circuitBreaker.enabled",value = "true"),// 是否开启断路器
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),// 请求次数
@HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"), // 时间窗口期
@HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "60"),// 失败率达到多少后跳闸
})
public String paymentCircuitBreaker(@PathVariable("id") Integer id) {
if(id < 0) {
throw new RuntimeException("******id 不能负数");
}
String serialNumber = IdUtil.simpleUUID();
return Thread.currentThread().getName()+"\t"+"调用成功,流水号: " + serialNumber;
}
public String paymentCircuitBreaker_fallback(@PathVariable("id") Integer id) {
return "id 不能负数,请稍后再试,/(ㄒoㄒ)/~~ id: " +id;
}
PaymentController
@GetMapping("/payment/circuit/{id}")
public String paymentCircuitBreaker(@PathVariable("id") Integer id) {
String result = paymentService.paymentCircuitBreaker(id);
log.info("****result = " + result);
return result;
}
测试
一次正确(id正数)一次错误(id负数)尝试,可以一直保持正常
重点测试:
多次错误(id负数),然后慢慢正确(id正数),发现刚开始不满足条件,就算是正确的访问也不能进行
④ 原理/小总结
大神结论 - Martin:
熔断类型
- 熔断打开:请求不再调用当前服务,内部设置一般为MTTR(平均故障处理时间),当打开长达导所设时钟则进入半熔断状态
- 熔断关闭:熔断关闭后不会对服务进行熔断
- 熔断半开:部分请求根据规则调用当前服务,如果请求成功且符合规则则认为当前服务恢复正常,关闭熔断
官网断路器流程图
官网步骤
断路器在什么情况下开始起作用
断路器开启或者关闭的条件
- 当满足一定的阈值的时候(默认10秒钟超过20个请求次数)
- 当失败率达到一定的时候(默认10秒内超过50%的请求次数)
- 到达以上阈值,断路器将会开启
- 当开启的时候,所有请求都不会进行转发
- 一段时间之后(默认5秒),这个时候断路器是半开状态,会让其他一个请求进行转发. 如果成功,断路器会关闭,若失败,继续开启.重复4和5
断路器打开之后
ALl配置
(8) 服务限流
后面高级篇讲解alibaba的Sentinel说明
🔺 hystrix工作流程
https://github.com/Netflix/Hystrix/wiki/How-it-Works
🔺 服务监控hystrixDashboard
(1) 概述
(2) 仪表盘9001
① 新建模块 cloud-consumer-hystrix-dashboard9001
② 配置 pom.xml
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<artifactId>cloud2020</artifactId>
<groupId>com.atguigu.springcloud</groupId>
<version>1.0-SNAPSHOT</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>cloud-consumer-hystrix-dashboard9001</artifactId>
<dependencies>
<!--hystrix dashboard-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
<!--监控-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<!--热部署-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-devtools</artifactId>
<scope>runtime</scope>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
</dependencies>
</project>
③ 配置 application.yml
server:
port: 9001
④ 创建主启动类
@SpringBootApplication
// 开启HystrixDashboard
@EnableHystrixDashboard
public class HystrixDashboardMain9001 {
public static void main(String[] args) {
SpringApplication.run(HystrixDashboardMain9001.class, args);
}
}
所有Provider微服务提供类(8001/8002/8003)都需要监控依赖部署
⑤ 测试
http://localhost:9001/hystrix
(3) 断路器演示(服务监控hystrixDashboard)
① 修改cloud-provider-hystrix-payment8001
注意:新版本Hystrix需要在 主启动类 PaymentHystrixMain8001 中指定监控路径
/**
* 此配置是为了服务监控而配置,与服务容错本身无观,springCloud 升级之后的坑
* ServletRegistrationBean因为springboot的默认路径不是/hystrix.stream
* 只要在自己的项目中配置上下面的servlet即可
* @return
*/
@Bean
public ServletRegistrationBean getServlet(){
HystrixMetricsStreamServlet streamServlet = new HystrixMetricsStreamServlet();
ServletRegistrationBean<HystrixMetricsStreamServlet> registrationBean = new ServletRegistrationBean<>(streamServlet);
registrationBean.setLoadOnStartup(1);
registrationBean.addUrlMappings("/hystrix.stream");
registrationBean.setName("HystrixMetricsStreamServlet");
return registrationBean;
}
② 监控测试
启动 8001,9001
正常访问
当访问负数的次数达到了阈值,就会开启Circuit
如何看 ?
- 7 色
- 1圈
- 1线
- 整图说明
- 整图说明2
搞懂一个才能看懂复杂的