redis会丢数据吗 redis挂了怎么恢复数据

转载

mob64ca1404baa2 2023-08-30 08:31:24

文章标签 redis会丢数据吗 redis 数据库数据主线程 文章分类 Redis 数据库

一、前言

我们在上一篇文章聊到了 redis 通过 aof 机制确保了数据的可靠性，但是 aof 日志记录的其实是操作过的命令，并不是实际数据本身，通过 aof 日志进行恢复需要消耗较多的时间，因为每个命令都要执行一遍。这个时间基本上和 aof 日志的大小成正比，如果数据量不大，那倒是无所谓，但是如果数据量特别大，恢复数据的时间可就长了，那么 redis 的团队难道就没考虑到这种情况吗？当然考虑到了，所以才有了 RDB 机制。

二、什么是 COW 机制

写时复制技术，实际上是linux 系统提供的一种内存优化手段，简单来说，就是在不修改源数据的情况下，并不会真正的去开辟新的内存空间，而是相关的变量引用仍然指向同一块内存区域，只有复制的变量数据发生变化时，才会开辟新空间，大大节约了内存的使用。

redis会丢数据吗 redis挂了怎么恢复数据_主线程

目前已经广泛运用在 PHP，Java 等语言的设计上。

三、RDB 机制是什么？

RDB 就是 Redis DataBase 的缩写，对 redis 来说，它是一种快照记录的方式，记录的是某一个时刻的数据，而不是操作。
以下是相关的配置文件说明：

#
# Save the DB on disk:
#   save <seconds> <changes>
# save "" 或者 注释掉所有的 save 可以关闭此功能
# 实际上下面的都是执行的 basave 命令

save 900 1 # 表示在900秒内至少有1个key 发生了变化则出发RDB机制
save 300 10 # 表示在300秒内至少有10个key 发生了变化则出发RDB机制
save 60 10000 # 表示在60秒内有至少有10个key 发生了变化则出发RDB机制

#bgsave 出错时停止写入
stop-writes-on-bgsave-error yes

# 是否使用LZF压缩字符串对象，默认为 yes
rdbcompression yes

# 是否开启校验和检查
rdbchecksum yes

# rdb 的文件名
dbfilename dump.rdb

由于是数据快照，所以在恢复数据的时候，redis 可以将 RDB 文件读入内存来快速恢复数据，因此 redis 在实现快照的时候采取的是全量数据快照的方式。

所谓的快照，可以简单的理解为给账本进行拍照存储。

因此我们需要考虑几个因素，照片谁来拍，多久拍一次，拍的时候账本还能动吗？

四、谁来拍照？

由于 Redis 是单线程的，理论上我们应该尽量避免会阻塞主线程的相关操作，因为这是十分致命的，因此 redis 提供了两个命令来生成 RDB 文件，分别是 save 和 bgsave。

save：在主线程中执行，会导致阻塞；
bgsave：创建一个子进程，专门用于写入 RDB 文件，避免了主线程的阻塞，这也是 Redis RDB 文件生成的默认配置。

127.0.0.1:6379> save
OK
127.0.0.1:6379> bgsave
Background saving started

五、拍的时候账本还能动吗？

首先，很明显账本当然是可以动的，如果不能动的话，主线程不就阻塞了，这是不能容忍的，但是如果账本可以动的话，使用 RDB 进行全量数据快照的时候会不会出问题呢。

在执行 bgsave 命令的时候，会基于主线程 fork 出一个 bgsave 子进程，因此 bgsave 子进程共享了主线程的所有内存数据，并开始将它们写入 rdb 文件中。

此时，主线程如果接收了修改这些数据的一些命令，那么这块数据就会被复制一份，生成对应的数据副本。然后主线程直接在这些副本数据上进行处理。而 bgsave 子进程就继续读取原来的数据写入文件中，这也是利用了操作系统提供的 cow 技术，数据发生改变再开辟新空间存数据，不改就指向原来的数据。

好比说，老板让财务帮忙进行拍照统计，财务开始工作后，如果有数据修改更改，财务会复制一份对应的数据到另一个账本里面，然后老板可以去另一个账本进行修改，这样不会影响到财务拍照了。

六、多久拍一次比较合适？

财务干活也需要时间，如果只依赖 RDB 机制，那么每两次拍照的间隔有变化的数据就是可能会丢失的最新数据。那么是不是这个间隔越短丢失的数据风险就越小呢？想的真美好，不把财务当人了吗？这不得累死他们。

我们需要考虑两个原因，假设每次快照的时间间隔很短，会有两个影响。

第一个是fork 的阻塞问题，每次主线程 fork 出 bgsave 进程的时候是会阻塞主线程的。
第二个是CPU的问题，高频率的每次全量数据写入磁盘，会有很多的 IO，虽然 redis 保证了存活的 bgsave 进程只能同时存在一个，但是仍然无法保证 CUP 过高的问题。

此时有人会说，那就不要全量了，我们改成增量怎么样？
假设我们第一次进行全量的写入，后续都改用增量的怎么样，只要改变的key ，我们才进行处理。

想法很美好，但是考虑到每个key 你都要做标记处理，额外的内存空间支出，就让人感觉有点亏了。毕竟内存，那么的贵。

七、两种机制混合使用

简单来说，内存快照以一定的频率执行，在两次快照之间，使用 AOF 日志记录这期间的所有命令操作。

因为 AOF 日志记录的是命令，因此日志的大小以及恢复数据的速度较慢。
而 RDB 恢复的数据快，却需要考虑两次快照间隔的数据变化问题。

那么进行两种方式的结合，就可以解决彼此的问题。恢复又快，AOF 又能解决 RDB 的间隔数据变化问题。

redis会丢数据吗 redis挂了怎么恢复数据_主线程_02

实际上就是，在每次间隔中，将相关的写命令记录在 AOF 日志中，在下次快照完成后，又可以清空旧的 AOF 。

八、总结

这篇文章我们讲了Redis 持久化机制的另一个方式 RDB , 它可以通过快照的方式快速恢复数据，通过结合 AOF 日志可以更好的实现又快又稳定的恢复机制，基于这两种机制，Redis 也可以实现持久化存储。从而提高了其使用的方便性。不过在日常的工作中，我们仍然不能直接把 redis 当做永久存储来用。非关系数据库相比于关系型数据库，还是有着很多不方便的地方，如无法提供银行级别的事务机制，以及内存和磁盘的性价比等问题。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。