Redis的Hash的数据结构是怎样的?[面试7.0]

hash底层的存储结构包括ziplist(压缩列表)或hashtable(哈希表)
hash在同时满足以下两个条件的时候会使用ziplist(压缩列表):
哈希对象保存的键值对数量小于512个
哈希对象保存的所有键值对的键和值的字符串长度都小于64字节
压缩列表数据结构参考压缩列表章节,下图是hashtable的数据结构

RedisTemplate对hash排序 redis hash顺序_哈希算法


redis的hash数据结构


Redis的Hash储存数据的步骤是:


1.hash = dict->type->hashFunction(k0)// 计算hash值,底层使用MurmurHash3算法


2.index = hash & dict->ht[0].sizemask// hash值与字典的ht[0]的sizemask与操作得到储存索引


上图中K0和K1计算的hash值相同,发生hash碰撞,若发生碰撞Redis采用的是链地址法解决冲突,并使用头插法(头先插入新哈希表,尾后插入)的方式,Jdk1.7也是使用头插法(多线程下有死链问题),而Redis是单线程的所以不存在死链问题


下图是具体的代码关键部分:

RedisTemplate对hash排序 redis hash顺序_redis_02

Redis的数据结构Hash是怎么扩容的?[面试7.0]

RedisTemplate对hash排序 redis hash顺序_spring boot_03


redis的hash扩容

通过渐进式rehash机制实现:
当Hash表的负载因子大于5(dict_force_resize_ratio的默认值)时(ht[0].used/d->ht[0].size),为ht[1]分配空间,让字典同时持有ht[0]和ht[1]两个哈希表
扩容分配的ht[1]的空间大小为:第一个大于等于ht[0].used*2的2的n次方
顺便说一句:缩容分配的ht[1]的空间大小为:第一个大于等于ht[0].used的2的n次方
缩容条件是元素个数少于数组长度的10%

RedisTemplate对hash排序 redis hash顺序_spring_04


在字典中维持一个索引计数器变量rehashidx,并将它的值设置为0,表示rehash工作正式开始


在rehash进行期间,每次对字典执行CRUD操作时,先正常执行CRUD然后根据rehashidx的值将ht[0]对应位的所有键值对rehash到ht[1]表中,并且将rehashidx加一


当ht[0]中所有数据转移到ht[1]中时,将rehashidx设置成-1,表示rehash结束,移动完后将ht[1]和ht[0]交换位置,并使得新的ht[1]为下次rehash做好准备


RedisTemplate对hash排序 redis hash顺序_spring_05


渐进式rehash的好处在于它采取分治方式,避免了集中式rehash带来的庞大计算量(这是和HashMap不同的地方)


redis-hash数据结构和应用场景-诸葛[11分钟]


Redis-Hash底层详解(哈希表和字典)[阅10分钟]