[url=http://diaocow.iteye.com/blog/1938032]《Redis源码学习笔记》文章列表[/url]
[color=red]由于图片较大,缩放较为模糊,请双击打开查看原图 ^_^[/color]
在[url=http://diaocow.iteye.com/blog/1935050]主从复制[/url]过程中,我们提到过RDB文件,作为Redis持久化方式之一,RDB把数据库某一时刻的内容,也就是[b]快照[/b],以二进制的方式记录到文件,并且在下次启动的时候可以用来初始化Redis;
RDB最重要的两个过程是rdbSave和rdbLoad,下面我就这两个过程分别叙述;
[b][size=medium]rdbSave[/size][/b]
在具体看rdbSave过程之前,我们先看下RDB文件格式:
[img]http://dl2.iteye.com/upload/attachment/0089/6264/c85651c1-ee24-39ba-8899-c31376af1700.png[/img]
[b]我们可以简单思考下,RDB文件协议为什么会那样设计? [/b]
1. RDB文件以[b]"REDIS"[/b]开头是为了区分普通文件,这样redis在加载的时候,读取前五个字节就可以判断该文件是否为一个合法的RDB文件;
2. 写明RDB文件版本是因为不同版本之间有一定差异性,根据版本号需要保持向下兼容;
3. 以数据库为单位,存入键值对,因为一个redis实例中,可以包含16个数据库,所以一定要标明该键值对属于哪个数据库,否则无法还原到相应位置;
4. 在写入键值对信息时,超时时间是可选的,标明值类型(value-type)是为了在加载的时候知道这是一个string,还是list或者hashtable;
rdbSave过程就是把redis每一个数据库中的键值对按照上面定义的格式写入文件,伪代码:
def rdbSave(filename):
# 创建临时文件,用于保存rdb数据
tempFile = createTempFile()
rio = rioInitWithFile(tempFile)
# ----------------------------------
# 1.保存RDB文件版本
rdbSaveVersion(rio, "REDIS" + REDIS_RDB_VERSION)
# 2.保存redis所有数据库中的键值对
for db in redisServer.dbs:
# 记录键值对所在数据库
rdbSaveSelectDB(rio, db.num)
# 保存该数据库中所有键值对
for key, val in db.getKeyValuePairs():
expired_time = getExpiredTime(key)
rdbSaveKeyValuePair(rio, key, val, expired_time)
# 3.写入RDB文件结束符
rdbSaveEOF(rio, REDIS_RDB_OPCODE_EOF)
# 4.写入校验和
rdbSaveCkSum(rio)
# ----------------------------------
# 确认数据都被flush到磁盘
fsync()
rename(tempFile, filename)
def rdbSaveKeyValuePair(rio, key, val, expired_time):
if expired_time != -1:
# 过滤过期键
if expired_time < now_time:
return
rdbSaveMillisecondTime(rio, expired_time)
# 保存值类型(list? string? hashtable?)
rdbSaveValueType(rio, val)
# 保存键
rdbSaveKey(rio, key)
# 保存值
rdbSaveValue(rio, val)
更多细节请看:rdb.c/rdbSave函数
[b]触发rdbSave过程,主要有4种方式:[/b]
1. SAVE命令
2. BGSAVE命令
3. master接收到slave发来的sync命令
4. 定时save(配置文件中制定)
第一种情况,Redis保存RDB文件是在主进程中进行,所以在这其间,Redis无法响应客户端请求[i](再次强调:Redis是单线程Server)[/i];第二种情况,Redis fork出一个子进程,然后在子进程中进行rdbSave,因此也就不会阻塞主进程对客户端请求的处理;第三种情况和第四种情况同第二种情况,也是在子进程中进行;
[b][size=medium]rdbLoad[/size][/b]
rdbload过程就比较简单了,它会按照RDB文件协议,把键值对还原到相应的数据库,伪代码:
def rdbLoad(filename):
rio = rioInitWithFile(filename);
# 设置标记:
# a. 服务器状态:rdb_loading = 1
# b. 载入时间:loading_start_time = now_time
# c. 载入大小:loading_total_bytes = filename.size
startLoading(rio)
# ------------------------------------------
# 1.检查该文件是否为RDB文件(即文件开头前5个字符是否为"REDIS")
if !checkRDBHeader(rio):
redislog("error, Wrong signature trying to load DB from file")
return
# 2.检查当前RDB文件版本是否兼容(向下兼容)
if !checkRDBVersion(rio):
redislog("error, Can't handle RDB format version")
return
# 3.读取文件内容,加载键值对
while not end_of_file:
# 每循环一千次就处理一下客户端请求
if loops % 1000 == 0:
processClientRequest()
key, val, expired_time, dbnum = rdbLoadKeyValuePair()
# 过滤过期键
if expired_time != -1 and expired_time <= now_time:
continue
redisServer.db[dbnum].dict.add(key,value)
if expired_time > now_time
redisServer.db[dbnum].expires.add(key, expired_time)
loops = loops + 1
# 4. 校验和
if (!checkCkSum()): return
# ------------------------------------------
# 更新标记:rdb_loading = 0
stopLoading()
[b]触发rdbLoad过程,主要有两种方式:[/b]
1. Redis启动时候的初始化;
2. slave接收到master发来的RDB文件;
[b]总结:[/b]
1. 了解RDB文件格式;
2. 了解rdbSave和rdbLoad过程以及触发条件;