redis缓存概述

Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来一些问题,其中,尤为重要的是数据的一致性问题,从严格意义上讲,这个问题无解,如果对数据的一致性要求很高,那么就不能使用缓存。

缓存穿透(缓存中查不到)

概念

缓存穿透的概念很简单,用户想要查一个数据,发现redis内存数据库没有,也就是缓存没有命中,(比如秒杀场景)于是向持久层数据库查询.发现也没有,于是本次查询失败,当用户很多的时候,缓存都没有命中,于是都去请求了数据库,这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。

解决方法

1.布隆过滤器

布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力

图示:(图为别的网站截取,供参考。下同)

redis缓存postgresql redis缓存穿透_redis缓存postgresql


2.缓存空对象

当存储层不命中后,即使返回的空对象也将其缓存起来,同时设置一个过期时间,之后在访问这个数据将会从缓存中获取,保护了后端数据源。

redis缓存postgresql redis缓存穿透_缓存_02


但是这种方法会存在两个问题

如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更过的键,因此redis缓存当中可能会有很多的空值的键。

即使对空值设置了过期时间,还是会存在缓存层和存储层额数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。

缓存击穿(访问一个key量太大, 缓存过期)

概念

这里需要注意和缓存穿透的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,集中的访问一个key,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。

当某个key在过期的瞬间,有大量的请求并发的访问,这类数据一般就是热点数据,由于缓存过期,会同时访问数据库来查询最新的数据,会导致数据库压力过大

解决方法

1.设置热点数据永不过期

从缓存层面来看,没有设置过期时间,所以也不会出现热点key过期后产生的问题

2.加互斥锁

分布式锁: 使用分布式锁,保证对于每一个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可,这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大.

redis缓存postgresql redis缓存穿透_redis_03


缓存雪崩

缓存雪崩, 是指在某一个时间段,缓存集中过期失效 或者redis宕机

产生雪崩的原因之一, 比如在写文本的时候,马上就要到双十二零点,很快就要迎来一波抢购,这波商品时间比较集中的加入了缓存,假设缓存一小时,那么到了凌晨1点钟的时候,这批商品的缓存就过期了,而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰,于是所有的请求都会达到存储层,存储层的调用量就会暴增,造成存储层也挂掉的情况.

redis缓存postgresql redis缓存穿透_缓存_04


其实集中过期也不是非常致命,比较致命的缓存雪崩是缓存服务器某个节点宕机或断网,因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的,无非就是对数据库产生周期性的压力罢了,而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮.

在双11为保证服务的高可用,将一些其他的服务,比如退货退款服务。

解决方法
1.Redis高可用
这个思想的含义是,既然redis有可能挂掉,那我就多增设几台redis,这样一旦一台挂掉以后,其他的还可以继续工作,其实就是搭建的集群(异地多活)
2.限流降级
这个解决方案的思想是指,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量,比如对某一个key只允许一个线程查询和写缓存,其他线程等待
3.数据预热
我们提前给redis中嵌入部分数据,再提供服务。但是肯定不可能将所有数据都写入redis,因为数据量太大了,第一耗费的时间太长了,第二redis根本就容纳不下所有的数据。我们需要根据当天的具体访问情况,试试统计出频率较高的热数据。然后将访问频率较高的热数据写入到redis,可能热数据也比较多,我们也得多个服务并行的读取数据去写,并行的分布式的缓存预热。然后将嵌入的热数据的redis对外提供服务,这样就不至于冷启动,直接让数据库奔溃了。
总结
Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面,但同时,它也带来一些问题,其中,尤为重要的是数据的一致性问题,从严格意义上讲,这个问题无解,如果对数据的一致性要求很高,那么就不能使用缓存