HyperLogLog 是一种概率数据结构,它使用概率算法来统计集合的近似基数。而它算法的最本源则是伯努利过程。伯努利过程就是一个抛硬币实验的过程。抛一枚正常硬币,落地可能是正面,也可能是反面,二者的概率都是 1/2 。伯努利过程就是一直抛硬币,直到落地时出现正面位置,并记录下抛掷次数k。比如说,抛一次硬币就出现正面了,此时 k 为 1; 第一次抛硬币是反面,则继续抛,直到第三次才出现正面,此时
转载 2023-09-25 13:06:31
69阅读
redishyperloglog 原理命令及实战命令功能
原创 精选 2023-07-10 15:36:03
288阅读
Redis Hyperloglog的原理及数学理论的通俗理解 2022-01-24 17:06  tera 阅读(787)  评论(3)  编辑 收藏 举报 redis中有一种数据格式,hyperloglog,本文就此数据结构的作用、redis的实现及其背后的数学原理作一个整理。当然本文不包含任何数学公式,而是希
转载 2023-07-10 10:22:52
122阅读
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。 Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。 在 Redis 里面,每个 HyperLogLo
原创 2018-02-21 14:54:00
102阅读
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基 数。这和计算基数时,元素越
转载 2023-08-31 10:45:08
78阅读
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。 Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。 在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基 数。这和计算基数时,
原创 2022-10-11 16:28:22
37阅读
  Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。  在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。  因为 HyperLogLog
转载 2023-07-04 11:24:50
70阅读
1. 概述Redis 在 2.8.9 版本添加了 HyperLogLog 数据结构,用来做基数统计,其优点是在输入元素的数量非常大时,计算基数所需的空间比较小并且一般比较恒定。在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存就可以计算接近 2^64 个不同元素的基数。这和计算基数时,元素越多耗费内存越多的集合形成鲜明对比。但是,因为 HyperLogLog 只会根
十:redisHyperLogLog的使用与应用场景HyperLogLog为实现一种基数统计的算法,redis采用HyperLogLog来进行基数统计。 (redis2.8.9及之后的版本有提供这个功能)基数统计; 通常来统计一个集合中不重复的元素个数。为什么使用HyperLogLog而不是set或者bitmap如果我们使用set来进行基数统计,那么假设每一个元素的32Bit(2^24 ≈ 16
转载 2023-09-22 20:59:56
83阅读
作者 | 就是码哥呀在移动互联网的业务场景中,数据量很大,我们需要保存这样的信息:一个 key 关联了一个数据集合,同时对这个数据集合做统计。统计一个 APP 的日活、月活数;统计一个页面的每天被多少个不同账户访问量(Unique Visitor,UV));统计用户每天搜索不同词条的个数;统计注册 IP 数。通常情况下,我们面临的用户数量以及访问量都是巨大的,比如百万、千万级别的用户数量,或者千万
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。 Redis HyperLogLog 是用来做基数统计的算法 HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的 HyperLogLog 只会根据输入元素来计算基数
转载 2017-07-14 10:59:00
75阅读
2评论
# 使用 Spring Boot 和 RedisHyperLogLog ## 引言 在大数据时代,统计大型数据集中唯一元素的基数(cardinality)已经成为了一个重要的任务。在这方面,Redis 提供了一种名为 HyperLogLog 的数据结构,它能够高效地估算大量唯一元素的数量。本文将通过 Spring Boot 和 Redis 的集成来探讨 HyperLogLog 的使用,提
原创 2月前
13阅读
# Redis HyperLogLog 使用指南 在大数据处理和分析中,计算基数(即不重复元素的数量)是一个常见的需求。传统的方法在处理海量数据时可能会遇到性能瓶颈,而 Redis 提供的 HyperLogLog 数据结构则可以在保持高性能的前提下进行基数估算。本文将介绍 HyperLogLog 的基本原理、使用方法,以及相关的示例代码。 ## 什么是 HyperLogLog? HyperL
原创 1月前
7阅读
Redis HyperLogLogRedis 在 2.8.9 版本添加了 HyperLogLog 结构。Redis HyperLogLog 是用来做基数统计的算
原创 2022-05-25 18:25:40
129阅读
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体
原创 2023-09-25 11:32:19
58阅读
# Redis中的HyperLogLog实现 ## 简介 在介绍如何在Redis中实现HyperLogLog之前,我们先来了解一下HyperLogLog的概念。HyperLogLog是一种基数估计算法,用于估计一个集合的基数(元素的唯一数量),而不需要占用大量的内存空间。Redis中的HyperLogLog数据结构可以用于统计数据中的独立元素数量,例如统计网站的独立访客数量。 ## 流程 下面
原创 2023-09-09 07:17:08
46阅读
# RedisHyperLogLog:高效计数器的实现与应用 在大数据时代,我们经常需要对海量数据进行统计和分析。其中,基数统计(即统计不同元素的数量)是一个常见且重要的问题。但是,传统的基数统计方法通常需要大量的存储空间,这在处理大规模数据集时可能会成为一个瓶颈。为了解决这个问题,Redis引入了一种名为HyperLogLog的数据结构,它能够在极小的空间内实现高精度的基数统计。 ## H
原创 3月前
14阅读
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。   在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。和计算基数时,元素越
转载 2021-05-10 15:11:00
107阅读
2评论
Redis 在 2.8.9 版本添加了 HyperLogLog 结构。Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。   在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。和计算基数时,元素越
转载 2021-05-10 14:36:00
232阅读
2评论
思考一个常见的业务问题:如果你负责开发维护一个大型的网站,有一天老板找产品经理要网站每个网页每天的 UV 数据,然后让你来开发这个统计模块,你会如何实现?如果统计 PV 那非常好办,给每个网页一个独立的 Redis 计数器就可以了,这个计数器的 key 后缀加上当天的日期。这样来一个请求,incrb
转载 2020-04-22 17:07:00
93阅读
2评论
  • 1
  • 2
  • 3
  • 4
  • 5