istio如何限流 sentinel限流

转载

mob64ca14010a69 2024-04-05 22:03:03

文章标签 istio如何限流 Sentinel Spring Cloud 微服务开发语言 文章分类 云原生云计算

Sentinel 限流原理

一、限流规则

在Sentinel中，限流的直接表现形式是，在执行Entry nodeA =SphU.entry(resourceName) 的时候抛出 FlowException 异常。FlowException 是BlockException 的子类，可以捕捉 BlockException 来自定义被限流之后的处理逻辑。

并且，对于同一个资源或者不同资源可以分别创建多条限流规则，FlowSlot会对该资源的所有限流规则依次遍历，直到有规则触发限流或者所有规则遍历完毕。

限流规则主要由下面几个因素组成：

resource：资源名，即限流规则的作用对象
count : 限流阈值
grade : 限流阈值类型（QPS 或并发线程数）
limitApp : 流控针对的调用来源，若为 default 则不区分调用来源
strategy : 限流策略（基于调用关系的流量控制）
controlBehavior : 流量控制效果（直接拒绝、Warm Up、匀速排队）

Sentinel中提供了两个限流纬度：

并发线程数
QPS

也就是说，可以选择根据不同的纬度，根据这些纬度的指标去匹配限流规则，一旦达到阈值，则直接触发流量控制。
默认情况下是根据QPS来限流的，这个属性是通过grade进行设置。

二、并发线程数控制

并发数控制用于保护业务线程池不被慢调用耗尽。当应用所依赖的下游应用由于某种原因导致服务不稳定、响应延迟增加，对于调用者来说，意味着吞吐量下降和更多的线程数占用，极端情况下甚至导致线程池耗尽。

为了应对太多线程占用的情况，业内有使用隔离的方案，比如通过不同业务逻辑使用不同线程池来隔离业务自身之间的资源争抢（Hystrix 线程池隔离）。
这种隔离方案虽然隔离性比较好，但是代价就是线程数目太多，线程上下文切换的 (开销)比较大，特别是对低延时的调用有比较大的影响。

Sentinel 并发控制不负责创建和管理线程池，而是简单统计当前请求上下文的线程数目（正在执行的调用数目），如果超出阈值，新的请求会被立即拒绝，效果类似于Hystrix 信号量隔离。

并发线程数控制参数配置（并发线程数控制通常在调用端进行配置）：

grade: RuleConstant.FLOW_GRADE_THREAD
count: 此时它的含义是并发线程数量

三、QPS流量控制

当 QPS 超过某个阈值的时候，则采取措施进行流量控制行为（类似于我们前面说过的限流算法上的差异）。
Sentinel提供了四种流量控制行为

直接拒绝（CONTROL_BEHAVIOR_DEFAULT）
Warm Up（CONTROL_BEHAVIOR_WARM_UP）
匀速排队（CONTROL_BEHAVIOR_RATE_LIMITER，漏桶算法）
冷启动+匀速器（CONTROL_BEHAVIOR_WARM_UP_RATE_LIMITER），除了让流量缓慢增
加，还还控制的了请求的间隔时间，让请求均匀速度通过。

这四个行为，是通过FlowRule中的controlBehavior属性来控制，默认是直接拒绝。

3.1、直接拒绝

是默认的流量控制方式，当QPS超过任意规则的阈值后，新的请求就会被立即拒绝，拒绝方式为抛出FlowException。
这种方式适用于对系统处理能力确切已知的情况下，比如通过压测确定了系统的准确水位时。

3.2、Warm Up

即预热/冷启动方式。当系统长期处于低水位的情况下，当流量突然增加时，直接把系统拉升到高水位可能瞬间把系统压
垮。通过"冷启动"，让通过的流量缓慢增加，在一定时间内逐渐增加到阈值上限，给冷系统一个预热的时间，避免冷系统被压垮。

属性设置：
controlBehavior： RuleConstant.CONTROL_BEHAVIOR_WARM_UP
warmUpPeriodSec：预热时间，默认60s。

istio如何限流 sentinel限流_Sentinel