一、过期数据

首先,我们要了解下什么是过期数据?

redis是一个内存级的数据库,所有的数据都在内存中,之前我们知道,可以TTL指令来获取数据的状态:

  • 返回一个具体的时长代表一个具有时效性的数据
  • 返回-1代表永久有效的数据
  • 返回-2代表已经过期的数据或者被删除的数据或者未定义的数据

那么,过期的数据删除,怎么知道真的被删除了呢?

当redis发出一系列的指令给CPU去处理,指令少的时候CPU表示毫无压力,但是针对大批量的指令过来的时候,虽然在排着队执行,CPU的性能就会下来。对redis来说,一旦数据过期的时候,并不会立即删除,还是在内存中,等要删除的时候再去删除,怎么删除,就是redis的删除策略?

因此,过期数据是指那些设置过有效期又达到有效期之后的数据。有的数据可能很久才会被删除。

二、redis的数据删除策略

过期数据是怎么存储的呢?redis的内存空间在存储key,不仅仅是存储了key对应的value,还有value对应的地址;而在redis会开辟一片内存空间,hash的存储结构,filed就是失效数据的内存地址,value就是失效的时间,有了这个我们就知道那些数据需要删除。而我们的删除策略就紧密和这么一块内存的数据相关。

redis过期key手动删除 redis是如何删除过期数据的_redis

所谓删除策略,就是在内存和CPU中找一个平衡点,避免redis性能下降,甚至服务器宕机或者内存泄漏。

2.1 定时删除

  • 解释:创建一个定时器,当key设置有过期时间,且过期时间到达时,由定时器任务去执行对key的删除操作;删除key的数据同时,删除expire内区保存的地址信息;
  • 优点:节约内存,到时就删除,快速释放不必要的内存占用
  • 缺点:抢占CPU,当CPU负载很高的时候,会影响redis指令的响应时间和指令吞吐量

2.2 惰性删除

  • 解释:数据达到过期时间,不做处理,直到下次访问到这个数据时才去删除;也就是你的每一次的get操作都会和expireIfNeeded()相绑定,数据不到期就返回数据,到期就删除数据返回Nil
  • 优点:节约CPU性能
  • 缺点:大量失效数据积压之后,内存占用大,存储空间压力大

2.3 定期删除

上面两种方案都是相对比较极端的方案,那么定期删除就是一个比较折中的方案。

redis过期key手动删除 redis是如何删除过期数据的_数据_02

 在redis中,我们一般默认有16个DB,当然这个是可以配置的。

  • redis在启动服务器初始化的时候,会去读取配置server.hz的值,默认10.这个值的意义就是控制服务器每秒钟执行这么多次的定时轮巡(serverCron()),
  • 轮巡是对每个库进行轮巡(databaseCron()),紧接着会被每一个失效内存区域进行检测(activeExpireCycle()),每秒执行250ms/ server.hz
  • 随机挑选出W个key,如果key超时,删除key。如果这一轮中删除key的数量 > W * 25%,循环该过程;如果 < W * 25%, 检查下一个expire区域,重复此过程;至于W:自定义,= ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP属性值
  • 参数current_db会记录activeExpireCycle()进入哪个expire[i]执行,下一次到期继续从这里开始执行,这样就不会有被落下扫描的了。

简单来说,定期删除就是周期性的轮巡redis库中的时效性数据,采用随机抽取的策略,利用过期数据占比的方式控制删除频度;

特点:CPU性能占用设置有峰值,检查频度自定义;长期占用内存的数据会被持续清理;周期性的抽查存储空间

2.4 几种删除策略对比

类型

说明

定时删除

节约内存;不分时段占用CPU资源,频度高

惰性删除

内存占用严重;延迟执行,CPU利用率高

定期删除

内存定期随机清理;每秒花费固定的CPU去维护内存;随机抽查,重点抽查

一般来说,是惰性删除和定期删除结合使用。

三、逐出策略

上面我们说的删除策略操作的都是expire,都是有时效性的数据,失效了但是还在内存,要是所有数据都没过期,甚至都是永久有效的,内存不够了,这个添加数据会怎么样?

问题:把数据放在redis中,内存不足怎么办?

解释:Redis使用内存存储数据,在执行每一个命令之前,会调用freeMemoryIfNeeded()检查内存是否充足,如果不满足当前添加数据的要求,redis会临时清理一些数据作为新指令需要的存储空间。这种清理数据的算法成为逐出算法。

注意:逐出数据的过程并不能保证一定能清理出足够的空间,如果不成功则反复执行;当对所有数据尝试完毕后,还是不能满足需求,将报错。

影响逐出的几个相关配置:

  • 最大可以使用的内存 maxmemory:指占用物理内存的比例,默认0,表示不限制;一般设定50%以上。
  • 每次待选取删除的个数  maxmemory-samples :选取数据时并不会全库扫描,导致严重的性能消耗,降低读写性能。采用随机获取数据的方式作为待检测删除数据;
  • 删除策略 maxmemory-policy:达到最大内存后,对被挑选出来的数据进行删除的策略

逐出策略有哪几种呢?

检测易失数据:

  • volatile-lru:挑选最近最少使用的数据进行淘汰
  • volatile-lfu:挑选最近使用次数最少的数据进行淘汰
  • volatile-ttl:挑选将要过期的数据淘汰
  • volatile-random:任意选择数据淘汰

检测全库数据:

  • allkeys-lru:挑选最近使用的数据进行淘汰
  • allkeys-lfu:挑选最近使用次数最少的数据进行淘汰
  • volatile-random:任意选择数据淘汰

放弃驱逐策略:

  • no-enviction:禁止驱逐数据,但是可能引发OOM

数据逐出策略配置的依据:

  • 使用info指令输出监控信息,查看缓存hit和miss的次数,根据业务需求调优

不管使用哪一种,都会消耗CPU,还是要结合场景来选择,没有绝对好的策略。

 

这一篇就到这里。下一专题写redis的主从复制。