一.过期数据
Redis中的数据特征 :
Redis是一种内存级数据库,所有数据均存放在内存中,内存中的数据可以通过TTL指令获取其状态
- XX :具有时效性的数据
- -1 :永久有效的数据
- -2 :已经过期的数据或被删除的数据或未定义的数据
过期的数据真的删除了吗?
二.数据删除策略
- 定时删除
- 惰性删除
- 定期删除
redis数据保存策略 :
redis中用一个hash结构数据存放地址和过期时间,而删除策略就是基于这块hash数据结构
我们需要在内存占用与CPU占用之间寻找一种平衡,顾此失彼都会造成整体redis性能的下降,甚至引发服务器宕机或内存泄漏。CPU忙时暂且不维护内存,闲时再来进行内存释放。
1.定时删除(时间换空间)
- 创建一个定时器,当key设置有过期时间,且过期时间到达时,由定时器任务立即执行对键的删除操作
- 优点:节约内存,到时就删除,快速释放掉不必要的内存占用
- 缺点:CPU压力很大,无论CPU此时负载量多高,均占用CPU,会影响redis服务器响应时间和指令吞吐量
- 总结:用处理器性能换取存储空间(拿时间换空间)
2.惰性删除(空间换时间)
数据到达过期时间,先不做处理。等下次访问该数据时,发现数据已过期,删除,给客户端返回不存在。只要是调用操作数据的指令,都会先执行expireIfNeeded()
优点:节约CPU性能,发现不得不删除的时候才删除
缺点:内存空间压力很大,出现长期占用内存的数据
总结:用存储空间换取处理器性能 (空间换时间),适用于大内存,弱CPU场景
3.定期删除(中和以上两种方法)
前面两个是两个极端的方法,为避免前面方案带来的问题,Redis 引入了定期删除策略(折中方案)
周期性轮询 Redis 库中的时效性数据,采取随机抽取的策略,利用过期数据占比的方式控制删除频度。
在Redis服务器初始化时,读取server.hz的值,默认值为10。
定时轮询服务器,每秒钟执行server.hz次serverCron() 函数。
databaseCron() 在后台轮询处理 16 个 redis 数据库的操作,如这里的过期 key 的处理activeExpireCycle(),对每个数据库的expire空间进行检测,每次执行250ms/server.hz
随机选取一批expire空间的 key(redis有16个数据库,从0号数据库开始—15号数据库)
删除这批 key 中已过期的
如果这批 key 中已过期的占比超过25%,那么再重复执行步骤一。(循环到小于25%结束当前数据库的删除)
如果这批 key 中已过期的占比 ≤ 25%,检测下一个数据库的expire空间(current_db++)
定期删除:周期性轮询redis库中的时效性数据,采用随机抽取的策略,利用过期数据占比的方式控制删除频度
- 优点1:CPU性能占用设置有峰值,检测频度可自定义设置
- 优点2:内存压力不是很大,长期占用内存的冷数据会被持续清理
- 总结:周期性抽查存储空间 (随机抽查,重点抽查)
4.删除策略对比
- 定时删除 节约内存,无占用 不分时段占用CPU资源,频度高 拿时间换空间
- 惰性删除 内存占用严重 延时执行,CPU利用率高 拿空间换时间
- 定期删除 内存定期随机清理 每秒花费固定的CPU资源维护内存 随机抽查,重点抽查
三.逐出算法
当新数据进入redis时,如果内存不足怎么办?
- Redis使用内存存储数据,在执行每一个命令前,会调用freeMemoryIfNeeded()检测内存是否充足。如果内存不满足新加入数据的最低存储要求,redis要临时删除一些数据为当前指令清理存储空间。清理数据的策略称为逐出算法。
- 注意:逐出数据的过程不是100%能够清理出足够的可使用的内存空间,如果不成功则反复执行。当对所有数据尝试完毕后,如果不能达到内存清理的要求,将出现错误信息。 (error) OOM command not allowed when used memory >'maxmemory' 影响数据逐出的相关配置
最大可使用内存
maxmemory
占用物理内存的比例,默认值为0,表示不限制。生产环境中根据需求设定,通常设置在50%以上。
每次选取待删除数据的个数
maxmemory-samples
选取数据时并不会全库扫描,导致严重的性能消耗,降低读写性能。因此采用随机获取数据的方式作为待检测删除数据
删除策略
maxmemory-policy
达到最大内存后的,对被挑选出来的数据进行删除的策略
易失数据(可能会过期的数据集server.db[i].expires )
① volatile-lru:挑选最近最少使用的数据淘汰
② volatile-lfu:挑选最近使用次数最少的数据淘汰
③ volatile-ttl:挑选将要过期的数据淘汰
④ volatile-random:任意选择数据淘汰
检测全库数据(所有数据集server.db[i].dict )
⑤ allkeys-lru:挑选最近最少使用的数据淘汰
⑥ allkeys-lfu:挑选最近使用次数最少的数据淘汰
⑦ allkeys-random:任意选择数据淘汰
放弃数据驱逐
⑧ no-enviction(驱逐):禁止驱逐数据(redis4.0中默认策略),会引发错误OOM(Out Of Memory)