resp redis乱码 redis编码格式

转载

mob6454cc70a873 2024-07-31 14:14:24

文章标签 resp redis乱码 redis java lua 字符串 文章分类 Redis 数据库

文章目录

①. C语言源代码的核心部分
②. KV键值对到底是什么
③. 从set hello world说起
④. String - 3大编码格式
⑤. String - 重新设置SDS
⑥. 三大编码 - INT编码格式
⑦. 三大编码 - EMBSTR编码格式
⑧. 三大编码 - RAW编码格式

①. C语言源代码的核心部分

①. git源码地址:git clone https://github.com/redis/redis.git (redis-6.0.8\redis-6.0.8\src)

resp redis乱码 redis编码格式_redis

resp redis乱码 redis编码格式_java_02

②. Redis基本的数据结构(骨架)

简单动态字符串sds.c
整数集合intset.c
压缩列表ziplist.c
快速链表quicklist.c
字典dict.c
Streams的底层实现结构listpack.c和rax.c(了解)

③. Redis数据类型的底层实现

Redis对象object.c
字符串t_string.c
列表t_list.c
字典t_hash.c
集合及有序集合t_set.c和t_zset.c
数据流t_stream.c

④. Redis数据库的实现

数据库的底层实现db.c
持久化rdb.c和aof.c

⑤. Redis服务端和客户端实现

事件驱动ae.c和ae_epoll.c
网络连接anet.c和networking.c
服务端程序server.c
客户端程序redis-cli.c

⑥. 其他

主从复制replication.c
哨兵sentinel.c
集群cluster.c
其他数据结构,如hyperloglog.c、geo.c等
其他功能,如pub/sub、Lua脚本

②. KV键值对到底是什么

①. 总结语:redis是key-value存储系统,其中key类型一般为字符串, value类型则为redis对象(redisObject)

resp redis乱码 redis编码格式_lua_03

②. 6大类型说明(粗分)

传统的5大类型
新介绍的3大类型(bitmap、hyperLogLog:实质String | GEO:实质Zset)

③. 图解

resp redis乱码 redis编码格式_resp redis乱码_04

④. C语言struct结构体语法简介

resp redis乱码 redis编码格式_java_05

resp redis乱码 redis编码格式_字符串_06

⑤. 字典、KV是什么:每个键值对都会有一个dictEntry

resp redis乱码 redis编码格式_java_07

resp redis乱码 redis编码格式_java_08

⑥. redisObject +Redis数据类型+Redis 所有编码方式(底层实现)三者之间的关系

resp redis乱码 redis编码格式_resp redis乱码_09

③. 从set hello world说起

①. set hello word为例,因为Redis是KV键值对的数据库,每个键值对都会有一个dictEntry(源码位置:dict.h)

里面指向了key和value的指针,next指向下一个dictEntry
key是字符串,但是Redis没有直接使用C的字符数组,而是存储在redis自定义的SDS中
value既不是直接作为字符串存储,也不是直接存储在SDS中,而是存储在redisObject中
实际上五种常用的数据类型的任何一种,都是通过redisObject来存储的

②. redis看看类型:type key | 看看编码:object encoding hello | debug结构:debug object person

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> type hello 
string
127.0.0.1:6379> object encoding hello 
"embstr"
127.0.0.1:6379> debug object hello 
Value at:0x7fa41f80e3a0 refcount:1 encoding:embstr serializedlength:6 lru:891806 lru_seconds_idle:61
127.0.0.1:6379>

③. 为了便于操作,Redis采用redisObjec结构来统一五种不同的数据类型,这样所有的数据类型就都可以以相同的形式在函数间传递而不用使用特定的类型结构。同时,为了识别不同的数据类型, redisObjec中定义了type和encoding字段对不同的数据类型加以区别。简单地说,redisObjec就是string、hash、list、set、zset的父类

struct redisObject {
    /*对象的类型,包括:OBJECT_STRING、OBJECT_LIST、OBJECT_HASH、OBJECT_SET、OBJECT_ZSET */
    unsigned type:4;
    /*具体的数据结构*/ 
    unsigned encoding:4;
    /*24位,对象最后一次被命令程序访问的时间,与内存回收有关*/
    unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or
                            * LFU data (least significant 8 bits frequency
                            * and most significant 16 bits access time). */
    /*引用计数,当refcount=0的时候,表示该对象已经不被任何对象引用,则可以进行垃圾回收了*/
    int refcount;
    /*指向对象实际的数据结构*/
    void *ptr;
};

resp redis乱码 redis编码格式_resp redis乱码_10

④. RedisObject各字段的含义

4位的type表示具体的数据类型
4位的encoding表示该类型的物理编码方式见下表,同一种数据类型可能有不同的编码方式((比如String就提供了3种:int embstr raw))
lru字段表示当内存超限时采用LRU算法清除内存中的对象
refcount表示对象的引用计数
ptr指针指向真正的底层数据结构的指针

resp redis乱码 redis编码格式_lua_11

resp redis乱码 redis编码格式_resp redis乱码_12

④. String - 3大编码格式

①. int

保存long型(长整型)的64位(8个字节)有符号整数
9223372036854775807
上面数字最多19位
只有整数才会使用 int,如果是浮点数, Redis 内部其实先将浮点数转化为字符串值,然后再保存

②. embstr:代表embstr格式的SDS(Simple Dynamic String 简单动态字符串),保存长度小于44字节的字符串。EMBSTR顾名思义即:embedded string,表示嵌入式的String
③. raw:保存长度大于44字节的字符串

⑤. String - 重新设置SDS

①. C语言中字符串展示

resp redis乱码 redis编码格式_java_13

②. Redis没有直接复用C语言的字符串,而是新建了属于自己的结构-----SDS

在Redis数据库里,包含字符串值的键值对都是由SDS实现的(Redis中所有的键都是由字符串对象实现的即底层是由SDS实现,Redis中所有的值对象中包含的字符串对象底层也是由SDS实现)
redis会兼顾很多语言,比如java、py等,比如现在我们存的音频、视频文件中以二进制方式存储,有包含\0(123456\0789456),用C的字符串,就会导致789456丢失,导致数据丢失

# redis 3.2 以前
struct sdshdr {
    int len;
    int free;
    char buf[];
};

③. Redis为什么重新设计一个SDS数据结构？
解释:提供内存预分配,避免频繁内存分配

# redis 3.2 以前
struct sdshdr {
    int len;
    int free;
    char buf[];
};
# 1. 比如我现在set name tang
struct sdshdr {
    int len = 4
    int free = 0
    char buf[]= [tang]
};
# 2. append name zhi
# 预分配规则: [4(tang) + 3(zhi)] * 2 = 14长度
struct sdshdr {
    int len = 7
    int free = 7
    char buf[]= [tangzhi]
};
# 3. append name 123
# 这个时候在2时候已经预分配了14 > [4(tang) + 3(zhi) + 3(123)],不需要再额外分配
struct sdshdr {
    int len = 10
    int free = 4
    char buf[]= [tangzhi123]
};

resp redis乱码 redis编码格式_lua_14

④.redis3.2以前和之后的变化,为什么要有这些变化情况存在？- redis最终理念内存、内存、内存

在3.2以前,假设,我们的buf[]很小,特别小,int len是用4个字节进行存储的,太浪费了
针对于这种特别小的情况,3.2之后优化了代码,使用1个字节的flags,中的5位来表示长度,也就是2^5表示长度,达到内存优化的目的

# redis 3.2 以前
struct sdshdr {
    int len;
    int free;
    char buf[];
};
# redis 3.2 后
1. len:记录buf数组中已使用字节数量
2. flags:当前类型(不同的sdshdr)
3. alloc:不包括头和空结束符的字节数量
typedef **char** *sds;
struct __attribute__ ((__packed__)) sdshdr5 {

  unsigned char flags; /* 3 lsb of type, and 5 msb of string length */

  char buf[];

};

struct __attribute__ ((__packed__)) sdshdr8 {

  uint8_t len; /* used */

  uint8_t alloc; /* excluding the header and null terminator */

  unsigned char flags; /* 3 lsb of type, 5 unused bits */

  char buf[];

};

struct __attribute__ ((__packed__)) sdshdr16 {

  uint16_t len; /* used */

  uint16_t alloc; /* excluding the header and null terminator */

  unsigned char flags; /* 3 lsb of type, 5 unused bits */

  char buf[];

};

struct __attribute__ ((__packed__)) sdshdr32 {

  uint32_t len; /* used */

  uint32_t alloc; /* excluding the header and null terminator */

  unsigned char flags; /* 3 lsb of type, 5 unused bits */

  char buf[];

};

struct __attribute__ ((__packed__)) sdshdr64 {

static inline char sdsReqType(size_t string_size) {
    if (string_size < 32)  
        return SDS_TYPE_5;
    if (string_size < 0xff) //2^8 -1  
        return SDS_TYPE_8;
    if (string_size < 0xffff) // 2^16 -1  
        return SDS_TYPE_16;
    if (string_size < 0xffffffff)  // 2^32 -1 
        return SDS_TYPE_32;
    return SDS_TYPE_64;
}

resp redis乱码 redis编码格式_java_15

resp redis乱码 redis编码格式_resp redis乱码_16

resp redis乱码 redis编码格式_lua_17

⑤. set k1 v1底层发生了什么？调用关系

⑥. 三大编码 - INT编码格式

①. 我们先来瞅一瞅三大编码长什么样？

resp redis乱码 redis编码格式_字符串_18

②. 当字符串键值的内容可以用一个64位有符号整形来表示时,Redis会将键值转化为long型来进行存储,此时即对应 OBJ_ENCODING_INT 编码类型。内部的内存结构表示如下:
命令示例: set k1 123

resp redis乱码 redis编码格式_lua_19

③. Redis启动时会预先建立10000个分别存储0 - 9999的redisObject变量作为共享对象,这就意味着如果set字符串的键值在0~10000之间的话,则可以直接指向共享对象而不需要再建立新对象,此时键值不占空间

set k1 123
set k2 123

resp redis乱码 redis编码格式_redis_20

④. redis源代码:object.c

⑦. 三大编码 - EMBSTR编码格式

①. redis源代码:object.c
②. 对于长度小于44的字符串,Redis对键值采用OBJ_ENCODING_EMBSTR方式,EMBSTR顾名思义即:embedded string,表示嵌入式的String。从内存结构上来讲即字符串sds结构体与其对应的 redisObject对象分配在同一块连续的内存空间,字符串sds嵌入在redisObject对象之中一样
③. redis源代码:object.c(embStr不会重新再次开辟空间,而是会嵌入在redisObject里面)

⑧. 三大编码 - RAW编码格式

①. 先来瞅一瞅源码

resp redis乱码 redis编码格式_lua_21

②. 当字符串的键值为长度大于44的超长字符串时,Redis则会将键值的内部编码方式改为OBJ_ENCODING_RAW格式,这与OBJ_ENCODING_EMBSTR编码方式的不同之处在于,此时动态字符串sds的内存与其依赖的redisObject的内存不再连续了

resp redis乱码 redis编码格式_redis_22

③. 明明没有超过阈值,为什么变成raw了

resp redis乱码 redis编码格式_resp redis乱码_23

④. 只有整数才会使用int,如果是浮点数, Redis内部其实先将浮点数转化为字符串值,然后再保存
⑤. embstr与raw类型底层的数据结构其实都是SDS(简单动态字符串,Redis内部定义sdshdr一种结构)

resp redis乱码 redis编码格式_resp redis乱码_24

resp redis乱码 redis编码格式_字符串_25

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：ansibleping

下一篇：跳板机是干什么的 java中跳板机 ssh

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯