“Redis is an open source (BSD licensed), in-memory data structure store, used as database, cache and message broker.” -- Redis Official Website!
第一次详细的接触Redis是从官网开始的,上述摘自官网:Redis是一个基于BDS许可的开源的内存数据结构存储,用于数据库,缓存和消息代理。
- 从官网上的解释,我们知道:Redis是基于内存的,支持多种数据结构
- 从使用经验来说,我们知道:Redis常用作于缓存
在学习一项技术之前,我们应该问自己几个问题:为什么学习该项技术?使用该技术能为我们解决什么问题呢?。。。只有这样有目标的去学习,我们才能更好的理解所学习的技术的本质,更好的适用于不同的使用场景☺!我们先从“内存”、“数据结构”、“缓存”初识Redis。
初识Redis
- 为什么要使用Redis?
从上面的介绍中,Redis是基于内存的,常用来作为缓存的一种技术,并且Redis是以key-value形式进行存储的。
我们发现上述特性正是Java集合体系中Map容器具备的,直接使用Map不就可以了吗?为什么还要使用Redis呢?
- Java实现的Map结构是本地缓存,如果是集群环境下,每个实例都需要各自保存自己的一份缓存,缓存不具有一致性;
- Java实现的Map用作缓存,JVM内存太大是容易挂掉的。一般使用Map容器来存储临时数据,缓存的数据是随着JVM销毁而结束的。并且Map所存储的数据结构,缓存过期机制等等都需要我们自己实现,成本比较高;
- Redis实现的是分布式缓存,集群环境下,每个实例都共享同一份缓存,缓存具有一致性;除此之外,Redis可以将缓存数据保存在硬盘中,Redis重启了也可以将其恢复。原生提供了丰富的数据结构、缓存过期机制等等功能。
- 为什么使用缓存?
使用缓存的目的:不用每次读取数据时,都要查一次数据库。提高性能(因为缓存查询速度比数据库查询速度快的多),提高并发能力(因为缓存分担了部分的请求,支持更高的并发)。
最简单Web服务业务图:
简单web服务业务图
Redis基本数据结构
Redis有5种基本数据结构,分别是:string(字符串)、list(列表)、hash(字典)、set(集合)、zset(有序集合),学习这些数据结构是使用Redis的基础。【注意】:Redis是以key-value的形式进行存储的,Redis的key一定是字符串,value可以是string、list、hash、set、zset等这些数据类型。
学习这些基本数据类型之前,进行简单的说明:Redis并没有直接使用这些数据结构来实现key-value数据库,而是基于这些数据结构创建了一个对象系统。即:Redis使用对象来表示数据库中的键和值,每次我们在Redis中创建一个键值对时,至少会创建出两个对象。一个是键对象,一个是值对象。
简单来说就是:key是一个redisObject对象,value也是一个redisObject对象。每个对象都有type、encoding、ptr来表示。
typedef struct redisObject { // 类型 unsigned type:4; // 编码 unsigned encoding:4; // 对象最后一次被访问的时间 unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */ // 引用计数 int refcount; // 指向实际值的指针 void *ptr;} robj;
- string(字符串)
Redis中的字符串是一种简单动态字符串(Simple Dynamic String,SDS),这意味着使用者可以对其进行修改。Redis底层使用sdshdr结构来表示一个SDS值。【注】:Redis 规定了字符串的长度不得超过 512 MB。
struct sdshdr{ // 字节数组,用于保存字符串 char buf[]; // 记录buf数组中已使用的字节数量,也是字符串的长度 int len; // 记录buf数组未使用的字节数量 int free;}
- SDS与C语言中的字符串比较
- 获取字符串的长度时,时间复杂度是O(1),因为sdshdr数据结构中len属性记录字符串的长度
- SDS不会发生缓存溢出/内存溢出等溢出问题,因为如果修改了SDS,空间不足,会先扩展空间,在进行修改(内部实现了动态扩展机制)
- SDS可以减少内存分配的次数(free属性),实现了空间预分配机制
- SDS是二进制安全的,所有的SDS API都会以处理二进制的方式来处理SDS存放在buf数组中的数据
- list(列表)
Redis中的列表相当于Java中的LinkedList,list的插入和删除操作非常快,时间复杂度是O(1),但查询很慢,时间复杂度是O(n)。Redis中列表结构表示如下:
typedef struct list{ //表头结点 listNode *head; //表尾节点 listNode *tail; //链表长度 unsigned long len; //节点值复制函数 void *(*dup) (viod *ptr); //节点值释放函数 void (*free) (viod *ptr); //节点值对比函数 int (*match) (void *ptr,void *key);}list;
typedef strcut listNode{ //前置节点 strcut listNode *pre; //后置节点 strcut listNode *pre; //节点的值 void *value;}listNode;
Redis list结构
- Redis列表特性
- list是无环双向链表
- list获取表头指针、表尾指针、列表节点长度时间复杂度都是O(1)
- list使用void *指针来保存节点值,说明可以保存各种不同类型的值
- hash(字典)
Redis中的hash相当于Java中的HashMap,内部差不多类似,都是通过“数组 + 链表”的链地址法来解决部分hash冲突。
typedef struct dictht{ //存放一个数组的地址,数组中存放哈希节点dictEntry的地址 dictEntry** table; //哈希表table的大小,出始大小为4 unsingned long size; //用于将hash值映射到table位置的索引,大小为(size-1) unsingned long sizemask; //记录哈希表已有节点(键值对)的数量 unsingned long used; }dictht;
typedef struct dict{ dictType *type; //私有数据,保存着dictType结构中函数的 参数 void *privdata; //两张哈希表 dictht ht[2]; //rehash的标记,rehashidx == -1,表示没有进行 rehash long rehashidx; //正在迭代的迭代器数量 int itreators; }dict;
typedef struct dictEntry { //键 void *key; //值 union { void *value; uint64_tu64; int64_ts64; }v; //指向下个哈希节点,组成链表 struct dictEntry *next; }dictEntry;
typedef struct dictType{ //计算哈希值的函数 unsigned int (*hashFunction)(const void * key); //复制键的函数 void *(*keyDup)(void *private, const void *key); //复制值得函数 void *(*valDup)(void *private, const void *obj); //对比键的函数 int (*keyCompare)(void *privdata , const void *key1, const void *key2) //销毁键的函数 void (*keyDestructor)(void *private, void *key); //销毁值的函数 void (*valDestructor)(void *private, void *obj); }dictType;
从底层源码实现可以看出,Redis中hash内部维护了两个hashtable:
- ht[0]:用于存放真实的key-value数据
- ht[1]:用于扩容(rehash)
【渐进式扩容 rehash】
- Redis采用渐进式扩容的原因
- 数据量过大,一次rehash是相当耗时的,这可能导致服务器一段时间内停止服务
- 渐进式扩容条件
- 正常情况下,当hash表中元素的个数等于ht[0]数组的长度时,就会开始进行扩容操作,扩容的新数组是原数组大小的2倍。
- 如果Redis正在执行bgsave(持久化)操作,为了减少内存过多的分离,Redis尽量不进行扩容,但是如果hash表达到ht[0]数组长度的5倍,此时强制扩容
- Redis渐进式扩容过程
- 在字典中维持一个索引计数器变量rehashidx,并将其设置为0,表示rehash开始;
- 在rehash期间,每次对字典进行增删改查,除了执行指定命令外,还会将ht[0]中rehashidx索引上的值rehash到ht[1]中,操作完成后rehashidx+1;
- 字典操作不断执行,最终在某个时间点,所有的键值对完成rehash,这时将rehashidx设置为-1,表示rehash完成;
- 在渐进式rehash过程中,字典会同时使用两个哈希表ht[0]和ht[1],所有的更新、删除、查找操作也会在两个哈希表进行。例如要查找一个键的话,服务器会优先查找ht[0],如果不存在,再查找ht[1],诸如此类。此外当执行新增操作时,新的键值对一律保存到ht[1],不再对ht[0]进行任何操作,以保证ht[0]的键值对数量只减不增,直至变为空表。
- set(集合)
Redis中set相当于Java中的HashSet,内部的键值对是无序、唯一的。它内部实现相当于一个特殊的字典,字典中所有的value都是一个NULL值。所以这里对set不在做详细的介绍。
- zset(有序集合)
zset是Redis中最具特色的一个数据结构,类似于Java中SortedSet和HashMap的结合体,保证内部value唯一性的同时,也为其赋予了一个score值,用于排序。
Redis中zset内部实现是一个称为 跳跃表 的数据结构,这种数据结构比较复杂,具体关于跳跃表的内容后期会有专门的文章进行详解,这里不在阐述。
写在最后
本文主要简单介绍了一下为什么使用Redis?以及Redis的5种基本数据结构,作为开始Redis学习之旅的开端 ☺!通过上述的介绍,不同场景使用不同数据结构作为存储,可以简单总结:
- string:简单的key-value
- list:有序列表(底层是双向链表),可以做简单的队列
- hash:存储结构化数据
- set:无序列表(去重),提供一系列的交集、并集、补集的命令
- zset:可用于排行榜等
MySQL系列