「Redis数据结构」集合对象(Set)


文章目录

  • 「Redis数据结构」集合对象(Set)
  • 一、概述
  • 二、结构
  • 三、编码转换
  • 四、小结


一、概述

Set是Redis中的单列集合,其特点为不保证有序性、保证元素唯一、可以求交集、并集、差集。

redis保存集合 redis存储集合对象_redis

从上面我们可以看出,Set对查询元素的效率要求非常高,那么什么样的数据结构合适呢?


二、结构

HashTable

也就是Redis中的Dict,不过Dict是双列集合(可以存键、值对)Set是Redis中的集合,不一定确保元素有序,可以满足元素唯一、查询效率要求极高

  • 为了查询效率和唯一性,set采用HT编码(Dict)。Dict中的key用来存储元素,value统一为null。
  • 当存储的所有数据都是整数,并且元素数量不超过set-max-intset-entries时,Set会采用IntSet编码,以节省内存

快速回顾

「Redis数据结构」整数集合(intSet)

「Redis数据结构」哈希表(Dict)

redis保存集合 redis存储集合对象_redis保存集合_02

redis保存集合 redis存储集合对象_Redis_03


三、编码转换

当集合对象可以同时满足以下两个条件时, 对象使用 intset 编码:

  • 集合对象保存的所有元素都是整数值
  • 集合对象保存的元素数量不超过 512

不能满足这两个条件的集合对象需要使用 hashtable 编码。

对于使用 intset 编码的集合对象来说, 当使用 intset 编码所需的两个条件的任意一个不能被满足时, 对象的编码转换操作就会被执行: 原本保存在整数集合中的所有元素都会被转移并保存到字典里面, 并且对象的编码也会从 intset 变为 hashtable

编码转换案例

创建了一个只包含整数元素的集合对象, 该对象的编码为 intset

redis> SADD numbers 1 3 5
(integer) 3

redis> OBJECT ENCODING numbers
"intset"

不过, 只要我们向这个只包含整数元素的集合对象添加一个字符串元素, 集合对象的编码转移操作就会被执行hashtable:

redis> SADD numbers "seven"
(integer) 1

redis> OBJECT ENCODING numbers
"hashtable"

除此之外, 如果我们创建一个包含 512 个整数元素的集合对象, 那么对象的编码应该会是 intset

redis> EVAL "for i=1, 512 do redis.call('SADD', KEYS[1], i) end" 1 integers
(nil)

redis> SCARD integers
(integer) 512

redis> OBJECT ENCODING integers
"intset"

但是, 只要我们再向集合添加一个新的整数元素, 使得这个集合的元素数量变成 513 , 那么对象的编码转换操作就会被执行:

redis> SADD integers 10086
(integer) 1

redis> SCARD integers
(integer) 513

redis> OBJECT ENCODING integers
"hashtable"

四、小结

  • Set是Redis中的单列集合,具有无序性,元素唯一性的特点。
  • 当元素均为整型且元素个数小于set-max-intset-entries时,Set会采用IntSet编码,目的是节省内存。
  • 否则使用HashTable作为基本数据结构。

参考

《Redis 设计与实现》

黑马程序员