怎么理解缓存雪崩?


    举个简单的例子:如果所有首页的Key失效时间都是12个小时,中午13点刷新的,我零点有个秒杀活动大量用户涌入,假设当时每秒6000个请求,本来缓存在可以抗住每秒5000个请求,但是缓存当时所有的Key都失效了。此时1秒6000个请求全部落数据库,数据库必然扛不住,它会报警一下,真实情况可能DBA都没反应过来就直接挂了。此时,如果没有什么特别的方案来处理这个故障,DBA很着急,重启数据库,但是数据库立马又被新的流量给打死了。


    怎么处理缓存雪崩?


    处理缓存雪崩简单,在批量往Redis存数据的时候,把每个Key的实效时间都加上一个随机值就好了,这样可以保证数据不会在同一时间大面积实效。


    setRedis(Key,value,time + Math.random()* 10000)


    如果Redis是集群部署,将热点数据均匀分布在不同的redis库中也能避免全部失效的问题。


    或者设置热点数据永远不过期,有更新操作就更新缓存就好了(比如运营更新了首页商品,那你刷新下缓存就完事,不要设置过期时间)。


    怎么理解缓存穿透?


    缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求,我们的数据库的id都是1开始自增上去的,如发起id为-1的数据或id为特别大不存在的数据。这时的用户可能是攻击者,攻击会导致数据库压力过大,严重会击垮数据库。


    像这种你如果不对参数做校验,数据库id都是大于0的,我一直用小于0的参数请求,每次都能绕开Redis直接打到数据库,数据库也查不到,每次都这样,并发高点就容易崩掉了。


    1、缓存穿透在接口层增加校验,比如用户鉴权校验,参数做校验,不合法的参数直接Return。


    2、从缓存取不到的数据,在数据库中也没有取到,这时也可以将对应的Key的value写为null、未知错误、稍后重试这样的值,具体取啥问产品或者看具体的场景,缓存有效时间可以设置短点,如30秒(设置太长会导致正常情况也无法使用)。


    3、布隆过滤器,对于恶意攻击,向服务器请求大量不存在的数据造成的数据穿透,还可以使用布隆过滤器先做一次过滤,对于不存在的数据布隆过滤器一般都能够过滤掉,不让请求再往后端发送。当布隆过滤器说某个值存在时,这个值可能不存在,当它说不存在时,那就肯定不存在。


    4、这样可以防止攻击用户反复用同一个id暴力攻击,但是我们要知道正常用户是不会在单秒内发起这么多请求的,那网关层nginx也记得有配置项,可以让运维对单个IP每秒访问次数超出阈值的IP都拉黑。


    怎么理解缓存击穿?


    至于缓存击穿嘛,这个跟缓存雪崩有点像,但是又有一点不一样,缓存雪崩是因为大面积的缓存失效,打崩了DB,而缓存击穿是指一个Key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个Key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个完好无损的桶上凿开了一个洞。


    缓存击穿的话,设置热点数据永不过期,或者加上互斥锁就能搞定。