前言

为什么要用Nosql

一、NoSql概述

1.为什么要用Nosql

  1. 单机MySQL的时代。

一个基本的网站访问量一般不会太大,单个数据库完全足够。
那时候更多使用的静态网页html,服务器根本没有太大压力。
这时候网站的瓶颈是什么?

  • 数据量如果太大,一个机器放不下。
  • 数据量太大需要建立数据的索引(B+ Tree),一个服务器内存放不下。
  • 访问量读写混合,一个服务器承受不了。
  1. memcached缓存+MySQL+垂直拆分(读写分离)。

网站80%的情况都是在读,每次都要去查询数据库的话效率低,我们可以使用缓存来保证效率,减轻数据库的压力。
发展过程:优化数据结构和索引->文件缓存(IO)->Memcached缓存

  1. 分库分表+水平拆分+MySQL集群。
    M:master主节点
    S:slave从节点
    主从复制。
    使用分库分表来解决写的压力。
  2. 如今最近的年代。
    2010~2020十年之间,世界已经发生了翻天覆地的变化。(定位也是一种数据。音乐!热榜!)
    MySQL等关系型数据库就不够用了,数据量很多,变化很快。
    MySQL有些用来存储比较大的文件、博客、图片,数据库表很大,效率低下,如果有一种数据库来专门处理这种数据,
    MySQL压力就会变小(研究如何处理这些问题)。大数据的IO压力下,表几乎没法更大。
  3. 目前的互联网项目。
  4. 为什么要用NoSql
    用户的个人信息,社交网络,地理位置。用户自己产生的数据,用户日志等等爆发式增长。
    这时候我们就需要使用NoSql数据库,NoSql可以很好的处理以上的情况。

2.什么是NoSql

Not Only SQL(不仅仅是SQL)泛指非关系型数据库。
随着web2.0互联网的诞生,传统的关系型数据库很难对付,尤其是超大规模的高并发社区。
很多的数据类型:用户的个人信息,社交网络,地理位置。这些数据类型的存储不需要一个固定的格式!
不需要多余的操作就可以横向扩展的!Map<sring,Object>使用键值对来控制。

3.NoSql特点

  • 方便扩展(数据之间没有关系,很好扩展)
  • 大数据量高性能(redis一秒可以写8万次,读取11万,NoSql的缓存记录级,是一种细粒度的缓存,性能比较高)
  • 数据类型是多样型的(不需要事先设计数据库,随取随用。如果是数据量十分大的表,很多人就无法设计了)
  • 传统的RDBMS和NoSql
传统的RDBMS
 -结构化组织
 -SQL
 -数据和关系都存在单独的表中
 -操作,数据定义语言
 -严格的一致性
 -基础的事务
 -...
Nosql
 -不仅仅是数据
 -没有固定的查询语言
 -键值对存储,列存储,文档存储,图形数据库(社交关系)
 -最终一致性
 -CAP定理和BASE(异地多活)初级架构师!
 -高性能,高可用,高可扩
 -...

4.了解3V+3高

大数据时代的3V:主要是描述问题的
1.海量Volume
2.多样Variety
3.实时Velocity
大数据时代的3高:主要是对程序的要求
1.高并发
2.高可拓(随时水平拆分,机器不够了,可以扩展机器来解决 )
3.高性能(保证用户体验和效率)

真正在公司中的实践:NoSQL+RDBMS一起使用才是最强的,阿里巴巴的架构演进!
技术没有高低之分,就看你如何去使用!

5.阿里巴巴演进分析

敏捷开发概念 、极限编程概念!

6.NoSql的四大分类

KV键值对:
    - 新浪:redis
    - 美团:redis+Tair
    - 阿里、百度:redis+memcache
文档型数据库(bson格式和json一样):
    - MongDB(一般必须要掌握)
    - MongDB是一个基于分布式文件存储的数据库,C++编写,主要用来处理大量的文档。
    - MongDB是一个介于关系型数据库和非关系型数据中间的产品。MongDB是非关系型数据库中功能最丰富,最像关系型数据库的。
    - ConthDb
列存储数据库:
    - Hbase
    - 分布式文件系统
图关系型数据库
    - 他不是存图形,放的是关系,比如:朋友圈社交网络,广告推荐。
    - Neo4j,infoGrid

redis数据量级别 redis数据量支持多大_数据

二、Redis入门

1.概述

redis是什么

Redis(Remote Dictionary Server ),即远程字典服务。
是一个开源的使用ANSIC语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的APl。redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。
免费和开源!是当下最热门的NoSQL技术之一!也被人们称之为结构化数据库!

redis能干嘛

1. 内存存储、持久化,内存中数据是断电即失、所以说持久化很重要(rdb、aof)。
2. 效率高,可以用于高速缓存。
3. 发布订阅系统。
4. 地图信息分析。
5. 计时器、计数器(浏览量!)。
6. ......

特性

1. 多样的数据类型
2. 持久化
3. 集群
4. 事务

2.redis安装

3.测试性能

4.redis基础的知识

redis默认有16个数据库,默认使用第0个数据库,可以使用select进行切换数据库。

redis数据量级别 redis数据量支持多大_redis_02

# 查看数据库所有的key
keys *
# 切换数据库
select 3
# 查看DB大小
DBSIZE
# 清空数据库
flushdb
# 清空所有数据库
flushall

redis数据量级别 redis数据量支持多大_数据_03

redis是单线程的。

明白Redis是很快的,官方表示,Redis是基于内存操作,CPU不是Redis性能瓶颈,Redis的瓶颈是根据机器的内存和网络带宽,既然可以使用单线程来实现,就使用单线程了!

Redis是C语言写的,官方提供的数据为100000+的QPS,完全不比同样是使用key-value的Memecache差!
为什么单线程还那么快?

  1. 误区1:高性能的服务器一定是多线程的?不对
  2. 误区2:多线程(CPU上下文会切换!)一定比单线程效率高!?不对

先去了解:CPU>内存>硬盘的速度要有所了解!
核心:redis是将所有的数据全部放在内存中的,所以说使用单线程去操作效率就是最高的,多线程(CPU上下文会切换:耗时的操作!!!),对于内存系统来说,如果没有上下文切换效率就是最高的!多次读写都是在一个CPU上的,在内存情况下,这个就是最佳的方案!

三、五大数据类型

redis命令不区分大小写!

1.redis-key

127.0.0.1:6379> keys *
(empty list or set)
127.0.0.1:6379> set name sywl
OK
127.0.0.1:6379> keys *
1) "name"
127.0.0.1:6379> set age 1
OK
127.0.0.1:6379> keys *
1) "name"
2) "age"
127.0.0.1:6379> exists name # 判断当前key是否存在
(integer) 1
127.0.0.1:6379> exists name1
(integer) 0
127.0.0.1:6379> move name 1 # 将name移动到数据库1
(integer) 1
127.0.0.1:6379> keys *
1) "age"
127.0.0.1:6379> set name sywl
OK
127.0.0.1:6379> keys *
1) "name"
2) "age"
127.0.0.1:6379> get name
"sywl"
127.0.0.1:6379> expire name 10 # 设置key的过期时间,单位是秒
(integer) 1
127.0.0.1:6379> ttl name # 查看当前key的剩余时间
(integer) 6
127.0.0.1:6379> ttl name
(integer) 3
127.0.0.1:6379> ttl name
(integer) 0
127.0.0.1:6379> ttl name
(integer) -2
127.0.0.1:6379> get name
(nil)
127.0.0.1:6379> type name
none
127.0.0.1:6379> set name sywl
OK
127.0.0.1:6379> type name # 查看当前key的一个类型
string
127.0.0.1:6379> type age
string
127.0.0.1:6379>

redis数据量级别 redis数据量支持多大_redis_04

后面如果遇到不会的命令,可以在官网查看帮助文档!

2.string(字符串)

##################################
127.0.0.1:6379> set key1 v1 # 设置值
OK
127.0.0.1:6379> get key1 # 获取值
"v1"
127.0.0.1:6379> append key1 "hello" # 追加字符串,如果当前key不存在,就相当于set key1 v1设置值
(integer) 7
127.0.0.1:6379> get key1
"v1hello"
127.0.0.1:6379> strlen key1 # 获取字符串的长度
(integer) 7
127.0.0.1:6379> append key1 ",sywl"
(integer) 12
127.0.0.1:6379> get key1
"v1hello,sywl"
##################################
127.0.0.1:6379> set views 0 # 设置初始浏览量为0
OK
127.0.0.1:6379> get views
"0"
127.0.0.1:6379> incr views # 自增1,浏览量变为1
(integer) 1
127.0.0.1:6379> get views
"1"
127.0.0.1:6379> incr views
(integer) 2
127.0.0.1:6379> get views
"2"
127.0.0.1:6379> decr views # 自减1,浏览量-1
(integer) 1
127.0.0.1:6379> decr views
(integer) 0
127.0.0.1:6379> decr views
(integer) -1
127.0.0.1:6379> get views
"-1"
127.0.0.1:6379> incrby views 10 # 可以设置步长,指定增量
(integer) 9
127.0.0.1:6379> incrby views 10
(integer) 19
127.0.0.1:6379> decrby views 10 # 可以设置步长,指定减量
(integer) 9
##################################
# 字符串范围
127.0.0.1:6379> set key1 hello,kuangshen # 设置key1的值
OK
127.0.0.1:6379> get key1
"hello,kuangshen"
127.0.0.1:6379> getrange key1 0 3 # 截取字符串[0,3]
"hell"
127.0.0.1:6379> getrange key1 0 -1 # 获取全部字符串和get key是一样的
"hello,kuangshen"
# 替换
127.0.0.1:6379> set key2 abcdefg
OK
127.0.0.1:6379> get key2
"abcdefg"
127.0.0.1:6379> setrange key2 1 xx # 替换指定位置开始的字符串(从指定索引的这个位置开始替换)
(integer) 7
127.0.0.1:6379> get key2
"axxdefg"
##################################
# setex (set with expire) # 设置值并设置过期时间
# setnx (set if not exist) # 不存在时再设置(在分布锁中常常使用)
127.0.0.1:6379> setex key3 30 "hello" # 设置key3的值为hello,30秒后过期。如果key3存在则覆盖key3的值,并且30后过期
OK
127.0.0.1:6379> ttl key3
(integer) 24
127.0.0.1:6379> get key3
"hello"
127.0.0.1:6379> setnx mykey "redis" # 如果mykey不存在,创建mykey
(integer) 1
127.0.0.1:6379> keys *
1) "key2"
2) "mykey"
3) "key1"
127.0.0.1:6379> ttl key3
(integer) -2
127.0.0.1:6379> setnx mykey "MongoDB" # 如果mykey存在,则创建失败
(integer) 0
127.0.0.1:6379> get mykey
"redis"
##################################
# mset
# mget
127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3 # 同时设置多个值
OK
127.0.0.1:6379> keys *
1) "k2"
2) "k1"
3) "k3"
127.0.0.1:6379> mget k1 k2 k3 # 同时获取多个值
1) "v1"
2) "v2"
3) "v3"
127.0.0.1:6379> msetnx k1 v1 k4 v4 # msetnx是一个原子性操作,要么一起成功,要么一起失败
(integer) 0
127.0.0.1:6379> get k4
(nil)
# 对象
set user:1 {name:zhangsan,age:3} # 设置一个user:1对象,值为json字符
# 这里的key是一个巧妙的设计:user:{id}:{field},如此设计在redis中是完全ok的!
127.0.0.1:6379> mset user:1:name zhangsan user:1:age 2
OK
127.0.0.1:6379> mget user:1:name user:1:age
1) "zhangsan"
2) "2"
##################################
getset # 先get然后再set
127.0.0.1:6379> getset db redis # 如果不存在值,则返回nil
(nil)
127.0.0.1:6379> get db
"redis"
127.0.0.1:6379> getset db mongdb # 如果存在值,获取原来的的值,并设置新的值
"redis"
127.0.0.1:6379> get db
"mongdb"

数据结构是相通的!
String类似的使用场景:value除了是我们的字符串还可以是我们的数字!

  • 计数器
  • 统计多单位的数量
  • 粉丝数
  • 对象缓存存储!

3.List(列表)

在redis里面,我们可以把list完成:栈、队列、阻塞队列
所有的list命令都是由L开头的。

127.0.0.1:6379> lpush list one # 将一个值或多个值,插入到列表头部(左边)
(integer) 1
127.0.0.1:6379> lpush list two
(integer) 2
127.0.0.1:6379> lpush list three
(integer) 3
127.0.0.1:6379> lrange list 0 -1 # 获取list中的所有的值
1) "three"
2) "two"
3) "one"
127.0.0.1:6379> lrange list 0 1 # 通过区间获得list中具体的值[0,1]
1) "three"
2) "two"
127.0.0.1:6379> rpush list right # 将一个值或多个值,插入到列表尾部(右边)
(integer) 4
127.0.0.1:6379> lrange list 0 1
1) "three"
2) "two"
127.0.0.1:6379> lrange list 0 -1
1) "three"
2) "two"
3) "one"
4) "right"
##################################
# LPOP
# RPOP
127.0.0.1:6379> lpop list # 移除list的第一个元素
"three"
127.0.0.1:6379> rpop list # 移除list的最后一个元素
"right"
127.0.0.1:6379> lrange list 0 -1
1) "two"
2) "one"
##################################
# Lindex
127.0.0.1:6379> lrange list 0 -1
1) "two"
2) "one"
127.0.0.1:6379> lindex list 1 # 通过下标获得list中的某一个值
"one"
127.0.0.1:6379> lindex list 0
"two"
##################################
# Llen
127.0.0.1:6379> lpush list one
(integer) 1
127.0.0.1:6379> lpush list two
(integer) 2
127.0.0.1:6379> lpush list three
(integer) 3
127.0.0.1:6379> Llen list # 返回列表的长度
(integer) 3
##################################
# Lrem 移除指定的值
127.0.0.1:6379> lrange list 0 -1
1) "three"
2) "three"
3) "two"
4) "one"
127.0.0.1:6379> lrem list 1 one # 移除list集合中指定个数的value,精确匹配
(integer) 1
127.0.0.1:6379> lrange list 0 -1
1) "three"
2) "three"
3) "two"
127.0.0.1:6379> lrem list 1 three
(integer) 1
127.0.0.1:6379> lrange list 0 -1
1) "three"
2) "two"
127.0.0.1:6379> lpush list three
(integer) 3
127.0.0.1:6379> lrange list 0 -1
1) "three"
2) "three"
3) "two"
127.0.0.1:6379> lrem list 2 three
(integer) 2
127.0.0.1:6379> lrange list 0 -1
1) "two"
##################################
# Ltrim 修剪:list截断
127.0.0.1:6379> rpush mylist "hello"
(integer) 1
127.0.0.1:6379> rpush mylist "hello1"
(integer) 2
127.0.0.1:6379> rpush mylist "hello2"
(integer) 3
127.0.0.1:6379> rpush mylist "hello3"
(integer) 4
127.0.0.1:6379> ltrim mylist 1 2 # 通过下标截取指定的长度,这个list已经被改变了,截断了只剩下截取的元素[1,2]
OK
127.0.0.1:6379> lrange mylist 0 -1
1) "hello1"
2) "hello2"
##################################
# RpopLpush # 移除列表的最后一个元素,将他移动到新的列表中
127.0.0.1:6379> rpush mylist "hello"
(integer) 1
127.0.0.1:6379> rpush mylist "hello1"
(integer) 2
127.0.0.1:6379> rpush mylist "hello2"
(integer) 3
127.0.0.1:6379> rpoplpush mylist myotherlist # 移除列表的最后一个元素,将他移动到新的列表中
"hello2"
127.0.0.1:6379> lrange mylist 0 -1 # 查看原来的列表
1) "hello"
2) "hello1"
127.0.0.1:6379> lrange myotherlist 0 -1 # 查看目标列表中,确实存在该值
1) "hello2"
##################################
# Lset # 将列表中指定下标的值替换为另外一个值,更新操作
127.0.0.1:6379> exists list # 判断这个列表是否存在
(integer) 0
127.0.0.1:6379> lset list 0 item # 如果不存在列表,我们去更新就会报错
(error) ERR no such key
127.0.0.1:6379> lpush list value1
(integer) 1
127.0.0.1:6379> lrange list 0 -1
1) "value1"
127.0.0.1:6379> lset list 0 item # 如果存在,更新当前下标的值
OK
127.0.0.1:6379> lrange list 0 -1
1) "item"
127.0.0.1:6379> lset list 1 other # 如果下标值不存在,则会报错
(error) ERR index out of range
##################################
# Linsert # 将某个具体的value插入到列表中某个元素的前面或者后面
127.0.0.1:6379> rpush mylist hello
(integer) 1
127.0.0.1:6379> rpush mylist world
(integer) 2
127.0.0.1:6379> linsert mylist before "world" "other"
(integer) 3
127.0.0.1:6379> lrange mylist 0 -1
1) "hello"
2) "other"
3) "world"
127.0.0.1:6379> linsert mylist after "world" "new"
(integer) 4
127.0.0.1:6379> lrange mylist 0 -1
1) "hello"
2) "other"
3) "world"
4) "new"

小结

  • 他实际上是一个链表,before Node after,left,right 都可以插入值。
  • 如果key不存在,创建新的链表。
  • 如果key存在,新增内容。
  • 如果移除了所有值,空链表,也代表不存在。
  • 在两边插入或者改动值,效率最高;中间元素,相对来说效率会低一点。
    消息排队!消息队列(Lpush Rpop),栈(Lpush Lpop)

4.Set(集合)

set中的值是不能重复的!

##################################
127.0.0.1:6379> sadd myset hello # set集合中添加元素
(integer) 1
127.0.0.1:6379> sadd myset kuangshen
(integer) 1
127.0.0.1:6379> sadd myset lovekuangshen
(integer) 1
127.0.0.1:6379> smembers myset # 查看指定set集合中的所有值
1) "kuangshen"
2) "lovekuangshen"
3) "hello"
127.0.0.1:6379> sismember myset hello # 判断某一个值是不是在set集合中
(integer) 1
127.0.0.1:6379> sismember myset world # 判断某一个值是不是在set集合中
(integer) 0
##################################
127.0.0.1:6379> scard myset # 获取set集合中的内容元素个数
(integer) 3
##################################
# srem
127.0.0.1:6379> srem myset "hello" # 移除set集合中的指定元素
(integer) 1
127.0.0.1:6379> scard myset
(integer) 2
127.0.0.1:6379> smembers myset
1) "kuangshen"
2) "lovekuangshen"
##################################
set 无序不重复集合。抽随机
127.0.0.1:6379> smembers myset
1) "lovekuangshen2"
2) "kuangshen"
3) "lovekuangshen"
127.0.0.1:6379> srandmember myset # 随机抽选出一个元素
"lovekuangshen"
127.0.0.1:6379> srandmember myset
"lovekuangshen"
127.0.0.1:6379> srandmember myset
"kuangshen"
127.0.0.1:6379> srandmember myset 2 # 随机抽选出指定个数的元素
1) "kuangshen"
2) "lovekuangshen"
127.0.0.1:6379> srandmember myset 2
1) "kuangshen"
2) "lovekuangshen"
##################################
# 随机删除key
127.0.0.1:6379> smembers myset
1) "lovekuangshen2"
2) "kuangshen"
3) "lovekuangshen"
127.0.0.1:6379> spop myset # 随机删除set集合中的元素
"lovekuangshen"
127.0.0.1:6379> spop myset
"lovekuangshen2"
127.0.0.1:6379> smembers myset
1) "kuangshen"
##################################
# 将一个指定的值,移动到另外一个set集合中
127.0.0.1:6379> sadd myset hello
(integer) 1
127.0.0.1:6379> sadd myset world
(integer) 1
127.0.0.1:6379> sadd myset kuangshen
(integer) 1
127.0.0.1:6379> sadd myset2 set2
(integer) 1
127.0.0.1:6379> smove myset myset2 "kuangshen" # 将一个指定的值,移动到另外一个set集合中
(integer) 1
127.0.0.1:6379> smembers myset
1) "world"
2) "hello"
127.0.0.1:6379> smembers myset2
1) "set2"
2) "kuangshen"
##################################
共同关注(并集)
数字集合类
- 差集
- 交集
- 并集
127.0.0.1:6379> sadd key1 a
(integer) 1
127.0.0.1:6379> sadd key1 b
(integer) 1
127.0.0.1:6379> sadd key1 c
(integer) 1
127.0.0.1:6379> sadd key2 c
(integer) 1
127.0.0.1:6379> sadd key2 d
(integer) 1
127.0.0.1:6379> sadd key2 e
(integer) 1
127.0.0.1:6379> sdiff key1 key2 # 差集。key1集合与key2集合中,不同的且属于key1的元素
1) "a"
2) "b"
127.0.0.1:6379> sinter key1 key2 # 交集。key1集合和key2集合中,共同的元素;共同好友就是这样实现的
1) "c"
127.0.0.1:6379> sunion key1 key2 # 并集。key1集合和key2集合中,总共有多少元素
1) "c"
2) "a"
3) "e"
4) "b"
5) "d"

微博,A用户将所有关注的人放在一个set集合中!将它的粉丝也放在一个集合中!
共同关注,共同爱好,二度好友,推荐好友!(六度分割理论)

5.Hash(哈希)

Map集合,key-map,这个值是一个map集合。
本质和string类型没有太大区别,还是一个简单的key-value
set myhash field kuangshen

##################################
127.0.0.1:6379> hset myhash field1 kuangshen # set一个具体key-value
(integer) 1
127.0.0.1:6379> hget myhash field1 # 获取一个字段值
"kuangshen"
127.0.0.1:6379> hmset myhash field1 hello field2 world # set多个key-value
OK
127.0.0.1:6379> hmget myhash field1 field2 # 获取多个字段值
1) "hello"
2) "world"
127.0.0.1:6379> hgetall myhash # 获取全部的数据
1) "field1"
2) "hello"
3) "field2"
4) "world"
127.0.0.1:6379> hdel myhash field1 # 删除hash指定的key字段,对应的value也就消失了
(integer) 1
127.0.0.1:6379> hgetall myhash
1) "field2"
2) "world"
##################################
# HLen
127.0.0.1:6379> hmset myhash field1 hello field2 world
OK
127.0.0.1:6379> hgetall myhash
1) "field2"
2) "world"
3) "field1"
4) "hello"
127.0.0.1:6379> hlen myhash # 获取hash的字段数量
(integer) 2
##################################
127.0.0.1:6379> hexists myhash field1 # 判断hash中指定字段是否存在
(integer) 1
127.0.0.1:6379> hexists myhash field3
(integer) 0
##################################
# 只获得所有的field
# 之后的所有的value
127.0.0.1:6379> hkeys myhash # 只获得所有的field
1) "field2"
2) "field1"
127.0.0.1:6379> hvals myhash # 只获得所有的value
1) "world"
2) "hello"
##################################
# hincr
# hdecr
127.0.0.1:6379> hset myhash field3 5 # 指定增量
(integer) 1
127.0.0.1:6379> hincrby myhash field3 1 # 自增1
(integer) 6
127.0.0.1:6379> hincrby myhash field3 -1 # 自减1
(integer) 5
127.0.0.1:6379> hsetnx myhash field4 hello # 如果不存在则可以设置
(integer) 1
127.0.0.1:6379> hsetnx myhash field4 world # 如果存在则不能设置
(integer) 0

hash变更的数据user name age,尤其是是用户信息之类的,经常变动的信息!hash更适合于对象的存储,String更加适合字符串存储!

6.Zset(有序集合)

在set的基础上,增加了一个值,set k1 v1 zset k1 score1 v1

127.0.0.1:6379> zadd myset 1 one # 添加一个值
(integer) 1
127.0.0.1:6379> zadd myset 2 two 3 three # 添加多个值
(integer) 2
127.0.0.1:6379> zrange myset 0 -1
1) "one"
2) "two"
3) "three"
##################################
# 排序如何实现
127.0.0.1:6379> zadd salary 2500 xiaohong # 添加三个用户
(integer) 1
127.0.0.1:6379> zadd salary 5000 zhangsan
(integer) 1
127.0.0.1:6379> zadd salary 500 kuangshen
(integer) 1
# zrangebyscore key min max
127.0.0.1:6379> zrangebyscore salary -inf +inf # 显示全部用户,按照从小到大排序
1) "kuangshen"
2) "xiaohong"
3) "zhangsan"
127.0.0.1:6379> zrangebyscore salary -inf +inf withscores # 显示全部用户,按照从小到大排序,并且附带成绩
1) "kuangshen"
2) "500"
3) "xiaohong"
4) "2500"
5) "zhangsan"
6) "5000"
127.0.0.1:6379> zrangebyscore salary -inf 2500 withscores # 显示工资小于2500员工的升序排序
1) "kuangshen"
2) "500"
3) "xiaohong"
4) "2500"
127.0.0.1:6379> zrevrange salary 0 -1 # 显示全部用户,按照从大到小排序
1) "zhangsan"
2) "kuangshen"
127.0.0.1:6379> zrevrange salary 0 -1 withscores # 显示全部用户,按照从大到小排序,并且附带成绩
1) "zhangsan"
2) "5000"
3) "kuangshen"
4) "500"
##################################
# 移除rem中的元素
127.0.0.1:6379> zrange salary 0 -1
1) "kuangshen"
2) "xiaohong"
3) "zhangsan"
127.0.0.1:6379> zrem salary xiaohong # 移除集合中的指定元素
(integer) 1
127.0.0.1:6379> zrange salary 0 -1
1) "kuangshen"
2) "zhangsan"
127.0.0.1:6379> zcard salary # 获取有序集合中的数量
(integer) 2
##################################
127.0.0.1:6379> zadd myset 1 hello 2 world 3 kuangshen
(integer) 3
127.0.0.1:6379> zrange myset 0 -1
1) "hello"
2) "world"
3) "kuangshen"
127.0.0.1:6379> zcount myset 1 3 # 获取指定区间的数量[1,3]
(integer) 3
127.0.0.1:6379> zcount myset 1 2 # 获取指定区间的数量[1,2]
(integer) 2

其余的一些API,通过我们的学习,你们剩下的如果工作中有需要,这个时候你可以去查看官方文档!
案例思路:set 排序存储班级成绩表,工资表排序!
普通消息,1,重要消息 2,带权重进行判断!
排行榜应用实现,取TopN测试!

四、三种特殊数据类型

1.geospatial地理位置

朋友的定位,附近的人,打车距离计算?
Redis的Geo 在Redis3.2版本就推出了!这个功能可以推算地理位置的信息,两地之间的距离,方圆几里的人!
有效的经度从-180度到180度。
有效的纬度从-85.05112878度到85.05112878度。 当坐标位置超出上述指定范围时,该命令将会返回一个错误。 可以查询一些测试数据:http://www.jsons.cn/lngcodeinfo/0706D99C19A781A3/ 只有六个命令 官方文档:Redis GEOADD 命令_将指定的地理空间位置(纬度、经度、名称)添加到指定的key中

geoadd

# getadd 添加地理位置
# 规则:两级无法直接添加,我们一般会下载城市数据,直接通过java程序一次性导入!
127.0.0.1:6379> geoadd china:city 116.40 39.90 beijing
(integer) 1
127.0.0.1:6379> geoadd china:city 121.47 31.23 shanghai
(integer) 1
127.0.0.1:6379> geoadd china:city 106.50 29.53 chongqing 114.05 22.52 shenzhen
(integer) 2
127.0.0.1:6379> geoadd china:city 120.16 30.24 hangzhou 108.96 34.26 xian
(integer) 2

geopos

# 获得当前定位:一定是一个坐标值
127.0.0.1:6379> geopos china:city beijing # 获取指定城市的经纬度
1) 1) "116.39999896287918091"
   2) "39.90000009167092543"
127.0.0.1:6379> geopos china:city beijin chongqing
1) 1) "116.39999896287918091"
   2) "39.90000009167092543"
2) 1) "106.49999767541885376"
   2) "29.52999957900659211"

geodist

两人之间的距离。
单位:

  • m 表示单位为米。
  • km 表示单位为千米。
  • mi 表示单位为英里。
  • ft 表示单位为英尺
127.0.0.1:6379> geodist china:city beijing shanghai km # 查看北京到上海的直线距离
"1067.3788"
127.0.0.1:6379> geodist china:city beijin chongqing km # 查看北京到重庆的直线距离
"1464.0708"

georadius:以给定的经纬度为中心,找出某一半径内的元素

我附近的人?(获得所有附近的人的地址,定位!)通过半径来查询!
获得指定数量的人。
所有的数据应该都录入到集合:china:city,才会让结果更加清晰。

127.0.0.1:6379> georadius china:city 110 30 1000 km # 以110,30这个经纬度为中心,寻找方圆1000km内的城市
1) "chongqi"
2) "xian"
3) "shenzhen"
4) "hangzhou"
127.0.0.1:6379> georadius china:city 110 30 500 km
1) "chongqi"
2) "xian"
127.0.0.1:6379> georadius china:city 110 30 500 km withdist # 显示到中心位置的直线距离
1) 1) "chongqi"
   2) "341.9374"
2) 1) "xian"
   2) "483.8340"
127.0.0.1:6379> georadius china:city 110 30 500 km withcoord # 显示他人的定位信息
1) 1) "chongqi"
   2) 1) "106.49999767541885376"
      2) "29.52999957900659211"
2) 1) "xian"
   2) 1) "108.96000176668167114"
      2) "34.25999964418929977"
127.0.0.1:6379> georadius china:city 110 30 500 km withdist count 1 # 筛选出指定的结果,符合条件的1条记录
1) 1) "chongqi"
   2) "341.9374"
127.0.0.1:6379> georadius china:city 110 30 500 km withdist count 2 # 筛选出指定的结果,符合条件的2条记录
1) 1) "chongqi"
   2) "341.9374"
2) 1) "xian"
   2) "483.8340"

georadiusbymember:找出位于指定元素周围的其他元素

127.0.0.1:6379> georadiusbymember china:city beijing 1000 km
1) "beijing"
2) "xian"
127.0.0.1:6379> georadiusbymember china:city shanghai 400 km
1) "hangzhou"
2) "shanghai"

geohash:返回一个或多个位置元素的geohash表示。该命令将返回11个字符的Geohash字符串!

# 将二维的经纬度转换为一维的字符串,如果两个字符串越接近,那么则距离越近
127.0.0.1:6379> geohash china:city beijin chongqi
1) "wx4fbxxfke0"
2) "wm5xzrybty0"

GEO底层的实现原理其实就是Zset!我们可以使用Zset命令来操作geo!

127.0.0.1:6379> zrange china:city 0 -1 # 查看地图中全部的元素
1) "chongqing"
2) "xian"
3) "shenzhen"
4) "hangzhou"
5) "shanghai"
6) "beijing"
127.0.0.1:6379> zrem china:city beijing # 移除指定元素
(integer) 1
127.0.0.1:6379> zrange china:city 0 -1
1) "chongqing"
2) "xian"
3) "shenzhen"
4) "hangzhou"
5) "shanghai"

2.hyperloglog

什么是基数?

A{1,3,5,7,8,7}的基数数量是5个(1,3,5,7,8)
B{1,3,5,7,8}的基数数量是5个(1,3,5,7,8)
基数就是不重复的数的总数,可以接受误差。

简介

redis2.8.9版本就更新了Hyperloglog数据结构。
redis Hyperloglog基数统计的算法。
优点:占用的内存是固定,2的64次方不同的元素的技术,只需要费12KB内存!如果要从内存角度来比较的话Hyperloglog首选!
网页的UV(一个人访问一个网站多次,但是还是算作一个人!)传统的方式,set保存用户的id,然后就可以统计set中的元素数量作为标准判断!
这个方式如果保存大量的用户id,就会比较麻烦!我们的目的是为了计数,而不是保存用户id;
0.81%的错误率。统计UV任务,可以忽略不计的。

127.0.0.1:6379> pfadd mykey a b c d e f g h i j # 创建第一组元素mykey
(integer) 1
127.0.0.1:6379> pfcount mykey # 统计mykey中元素基数数量
(integer) 10
127.0.0.1:6379> pfadd mykey2 i j z x c v b n m # 创建第二组元素mykey2
(integer) 1
127.0.0.1:6379> pfcount mykey2
(integer) 9
127.0.0.1:6379> pfmerge mykey3 mykey mykey2 # 合并mykey mykey2 => mykey3并集
OK
127.0.0.1:6379> pfcount mykey3 # 统计并集的数量
(integer) 15

如果允许容错,那么一定可以使用Hyperloglog!
如果不允许容错,就使用set或自己的数据类型即可!

3.bitmap

为什么其他教程都不喜欢讲这些?这些在生活中或者开发中,都有十分多的应用场景,学习了,就是就是多一个思路!

位存储

统计用户信息,活跃,不活跃!登录、未登录!打卡,365打卡!两个状态的,都可以使用Bitmaps!
Bitmaps位图,数据结构!都是操作进制位来进行记录,就只有0和1两个状态!
365天=365bit 1字节=8bit 46个字节左右!
测试:
使用bitmap来记录周一到周日的打卡
周一:1 周二:0 周三:0 周四:1….

redis数据量级别 redis数据量支持多大_redis数据量级别_05

查看某一天是否有打卡!

127.0.0.1:6379> getbit sign 3
(integer) 1
127.0.0.1:6379> getbit sign 6
(integer) 0

统计操作,统计打卡的天数!

127.0.0.1:6379> bitcount sign # 统计这周的打卡记录,就可以看到是否有全勤!
(integer) 3

五、事务

Redis事务本质:一组命令的集合!一个事务中的所有命令都会被序列化,在事务执行过程的中,会按照顺序执行!
一次性、顺序性、排他性!执行一系列的命令!
——- 队列 set set set 执行 ——-
Redis事务没有隔离级别的概念!
所有的命令在事务中,并没有直接被执行!只有发起执行命令的时候才会执行!Exec
Redis单条命令是保存原子性的,但是事务不保证原子性!
redis的事务:

  • 开启事务(multi)
  • 命令入队(……)
  • 执行事务(exec)

1.正常执行事务!

127.0.0.1:6379> multi # 开启事务
OK
# 命令入队
127.0.0.1:6379> set k1 v1
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> get k2
QUEUED
127.0.0.1:6379> set k3 v3
QUEUED
127.0.0.1:6379> exec # 执行事务
1) OK
2) OK
3) "v2"
4) OK

2.放弃事务

127.0.0.1:6379> multi # 开启事务
OK
127.0.0.1:6379> set k1 v1
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> set k4 v4
QUEUED
127.0.0.1:6379> discard # 取消事务
OK
127.0.0.1:6379> get k4 # 事务队列中的命令都不会被执行!
(nil)

3.编译型异常(代码有问题!命令有错!),事务中所有的命令都不会被执行!

127.0.0.1:6379> multi
OK
127.0.0.1:6379> set k1 v1
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> set k3 v3
QUEUED
127.0.0.1:6379> getset k3 # 错误的命令。正确的命令应该是getset k3 value
(error) ERR wrong number of arguments for 'getset' command
127.0.0.1:6379> set k4 v4
QUEUED
127.0.0.1:6379> set k5 v5
QUEUED
127.0.0.1:6379> exec # 执行事务错误
(error) EXECABORT Transaction discarded because of previous errors.
127.0.0.1:6379> get k5 # 所有的命令都没有执行
(nil)

4.运行时异常(1/0),如果事务队列中存在语法性错误,那么执行命令的时候,其他命令式可以正常执行的,错误命令抛出异常!

127.0.0.1:6379> set k1 "v1"
OK
127.0.0.1:6379> multi
OK
127.0.0.1:6379> incr k1 # 会执行失败。字符串不能自增
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> set k3 v3
QUEUED
127.0.0.1:6379> get k3
QUEUED
127.0.0.1:6379> exec
1) (error) ERR value is not an integer or out of range # 虽然第一条命令报错了,但是依旧正常执行成功了。
2) OK
3) OK
4) "v3"
127.0.0.1:6379> get k2
"v2"
127.0.0.1:6379> get k3
"v3"

5.监控! Watch (面试常问)

悲观锁:

  • 很悲观,认为什么时候都会出问题,无论做什么都会加锁!

乐观锁:

  • 很乐观,认为什么时候都不会出问题,所以不会上锁!更新数据的时候去判断一下,在此期间是否有人修改过这个数据!
  • 获取version
  • 更新的时候比较 version

redis监视测试

正常执行成功!

127.0.0.1:6379> set money 100
OK
127.0.0.1:6379> set out 0
OK
127.0.0.1:6379> watch money # 监视money对象
OK
127.0.0.1:6379> multi # 事务正常结束,数据期间没有发生变动,这个时候就正常执行成功。
OK
127.0.0.1:6379> decrby money 20
QUEUED
127.0.0.1:6379> incrby out 20
QUEUED
127.0.0.1:6379> exec
1) (integer) 80
2) (integer) 20

测试多线程修改值,使用watch可以当作redis的乐观锁操作!

127.0.0.1:6379> watch money # 监控money
OK
127.0.0.1:6379> multi
OK
127.0.0.1:6379> decrby money 10
QUEUED
127.0.0.1:6379> incrby out 10
QUEUED
127.0.0.1:6379> exec # 执行之前,另外一个线程,修改了我们的值,这个时候,就会导致事务执行失败!
(nil)
###############################
# 这是另外一个线程,在上面的线程执行事务之前,修改了money的值!
127.0.0.1:6379> get money
"80"
127.0.0.1:6379> set money 1000
OK
###############################
# 如果修改失败,获取最新的值就好
127.0.0.1:6379> unwatch # 1.如果发现事务执行失败,就先解锁
OK
127.0.0.1:6379> watch money # 2.获取最新的值,再次监视。select version
OK
127.0.0.1:6379> multi
OK
127.0.0.1:6379> decrby money 1
QUEUED
127.0.0.1:6379> incrby money 1
QUEUED
127.0.0.1:6379> exec # 3.对比监视的值是否发生了变化,如果没有变化,那么可以执行成功,如果变化就执行失败。
1) (integer) 999
2) (integer) 1000

六、jedis

我们要使用Java来操作Redis
什么是jedis?官方推荐的java连接开发工具!使用Java操作Redis中间件!如果你要使用java操作redis,那么一定要对redis十分的熟悉!

使用jedis的步骤

  1. 导入jedis的jar包
<!--jedis-->
<dependency>
 <groupId>redis.clients</groupId>
 <artifactId>jedis</artifactId>
 <version>3.6.3</version>
</dependency>
<!--fastjson-->
<dependency>
 <groupId>com.alibaba</groupId>
 <artifactId>fastjson</artifactId>
 <version>1.2.78</version>
</dependency>
  1. 编码测试
public static void main(String[] args) {
     // 1.连接redis地址
     Jedis jedis = new Jedis("127.0.0.1", 6379);
     // 2.连接密码
     jedis.auth("123456");
     // 3.测试。输出PONG
     System.out.println(jedis.ping());
 }

jedis再次理解事务

public static void main(String[] args) {
        // 1.连接redis地址
        Jedis jedis = new Jedis("127.0.0.1", 6379);
        // 2.连接密码
        jedis.auth("123456");
        JSONObject jsonObject = new JSONObject();
        jsonObject.put("hello","world");
        jsonObject.put("name","kuangshen");
        String s = jsonObject.toJSONString();
        // 开启事务
        Transaction multi = jedis.multi();
        try {
            multi.set("user1",s);
            multi.set("user2",s);
            // int i = 1/0; // 代码执行异常时,事务执行失败,会放弃事务
            multi.exec(); // 执行事务
        } catch (Exception e) {
            multi.discard(); // 放弃事务
            e.printStackTrace();
        } finally {
            System.out.println(jedis.get("user1"));
            String user2 = jedis.get("user2");
            jedis.close(); // 关闭连接
        }
    }

七、springboot整合redis

springboot操作数据:spring-data jpa jdbc mongdb redis
springData也是和springBoot齐名的项目
说明:springboot 2.x版本以后,默认使用的jedis,替换成了默认lettuce?
jedis:采用的直连,多线程操作的话,是不安全的;如果要避免不安全,要使用jedis pool连接池!更像BIO模式。
lettuce:采用netty,实例可以在多个线程中进行共享,不存在线程不安全的情况;可以减少线程数量!更像NIO模式。
源码分析:

public class RedisAutoConfiguration {
    public RedisAutoConfiguration() {
    }
    @Bean
    @ConditionalOnMissingBean(
        name = {"redisTemplate"}
    ) // 我们可以自己定义一个redisTemplate类来替换这个默认的类。
    @ConditionalOnSingleCandidate(RedisConnectionFactory.class)
    public RedisTemplate<Object, Object> redisTemplate(RedisConnectionFactory redisConnectionFactory) {
        // 默认的redisTemplate类没有过多的配置,redis对象都需要序列化。
        // 两个泛型都是Object类型,我们后面使用需要强转成<String,Object>
        RedisTemplate<Object, Object> template = new RedisTemplate();
        template.setConnectionFactory(redisConnectionFactory);
        return template;
    }
    @Bean// 由于string是redis最常使用的类型,所以单独提出了一个方法
    @ConditionalOnMissingBean
    @ConditionalOnSingleCandidate(RedisConnectionFactory.class)
    public StringRedisTemplate stringRedisTemplate(RedisConnectionFactory redisConnectionFactory) {
        return new StringRedisTemplate(redisConnectionFactory);
    }
}

整合步骤

  • 导入依赖
<!--操作redis-->
<dependency>
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
  • 配置连接
spring:
redis:
  host: 127.0.0.1
  port: 6379
  password: 123456
  • 测试
class Demo02ApplicationTests {
  @Autowired
  private RedisTemplate redisTemplate;
  @Test
  void contextLoads() {
      redisTemplate.opsForValue().set("mykey","kuangshen");
  }
}

自定义redisTemplate

import com.fasterxml.jackson.annotation.JsonAutoDetect;
import com.fasterxml.jackson.annotation.PropertyAccessor;
import com.fasterxml.jackson.databind.ObjectMapper;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.data.redis.connection.RedisConnectionFactory;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.data.redis.serializer.Jackson2JsonRedisSerializer;
import org.springframework.data.redis.serializer.StringRedisSerializer;
@Configuration
public class RedisConfig {
    /**
     * 自己定义了一个redisTemplate
     * @param redisConnectionFactory
     * @return
     */
    @Bean
    public RedisTemplate<String, Object> redisTemplate(RedisConnectionFactory redisConnectionFactory) {
        // 为了自己开发方便,一般使用<String,Object>
        RedisTemplate<String, Object> template = new RedisTemplate();
        template.setConnectionFactory(redisConnectionFactory);
        // json的序列化配置
        Jackson2JsonRedisSerializer<Object> jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer<Object>(Object.class);
        ObjectMapper om = new ObjectMapper();
        om.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
        om.activateDefaultTyping(LaissezFaireSubTypeValidator.instance,
                ObjectMapper.DefaultTyping.NON_FINAL, JsonTypeInfo.As.PROPERTY);
        jackson2JsonRedisSerializer.setObjectMapper(om);
        // string的序列化配置
        StringRedisSerializer stringRedisSerializer = new StringRedisSerializer();
        // key采用string序列化方式
        template.setKeySerializer(stringRedisSerializer);
        // hash的key也采用string的序列化方式
        template.setHashKeySerializer(stringRedisSerializer);
        // value采用Jackson的序列化方式
        template.setValueSerializer(jackson2JsonRedisSerializer);
        // hash的value也采用Jackson的序列化方式
        template.setHashValueSerializer(jackson2JsonRedisSerializer);
        template.afterPropertiesSet();
        return template;
    }
}

八、redis的配置文件

redis启动的时候,就是通过配置文件启动的。

1.单位

配置文件单位对大小写不敏感

# 1k => 1000 bytes
# 1kb => 1024 bytes
# 1m => 1000000 bytes
# 1mb => 1024*1024 bytes
# 1g => 1000000000 bytes
# 1gb => 1024*1024*1024 bytes
#
# units are case insensitive so 1GB 1Gb 1gB are all the same.

2.包含

可以包含其他配置文件。可以把其他配置文件导入到主配置文件。

# include /path/to/local.conf
# include /path/to/other.conf

3.网络

bind 127.0.0.1 # 绑定的id
protected-mode yes # 保护模式,默认yes
port 6379 # 端口设置

4.通用 GENERAL

daemonize yes # 以守护进程的方式运行,默认为no,我们需要手动设置为yes
pidfile /var/run/redis_6379.pid # 如果以后台方式运行,我们就需要指定一个pid文件
# Specify the server verbosity level.
# This can be one of:
# debug (a lot of information, useful for development/testing)
# verbose (many rarely useful info, but not a mess like the debug level)
# notice (moderately verbose, what you want in production probably)
# warning (only very important / critical messages are logged)
loglevel notice # 设置日志级别
logfile "" # 默认的日志位置名。为空则是标准的输出
databases 16 # 数据库的数量,默认16个
always-show-logo yes # 是否显示logo,默认是开启的

5.快照 SNAPSHOTTING

持久化,在规定的时间内,执行了多少次操作,则会持久化到文件.rdb .aof
redis是内存数据库,如果没有持久化,那么数据断电即失。

# 在900秒(15min)内,如果至少有一个key进行了修改,我们就进行持久化操作。
save 900 1
# 在300秒(5min)内,如果至少有10个key进行了修改,我们就进行持久化操作。
save 300 10
# 在60秒(1min)内,如果至少有10000个key进行了修改,我们就进行持久化操作。
save 60 10000
stop-writes-on-bgsave-error yes #持久化如果出错,是否还需要继续工作。
rdbcompression yes # 是否压缩rdb文件,需要消耗一些cpu资源。
rdbchecksum yes # 保存rdb文件时,是否进行错误的校验。
dir ./ # rdb文件保存的目录,默认是当前目录。

6.REPLICATION主从复制

redis.conf配置文件配置主从复制:
在从机的配置文件上,配置上主机的ip地址,端口号,如果有密码,配置密码。

redis数据量级别 redis数据量支持多大_nosql_06

7.SECURITY

# 配置文件中设置密码为123456
requirepass 123456 # redis默认是没有密码的。
# 命令查看密码
config get requirepass
# 命令设置密码
config set requirepass123456
# save命令保存配置文件
save

8.限制CLIENTS

maxclients 10000 # 设置同时连接上redis的最大客户端数量。
maxmemory <bytes> # 配置redis最大的内存容量。
maxmemory-policy noeviction # 内存到达上限之后的处理策略。
    1、volatile-lru:只对设置了过期时间的key进行LRU(默认值)
    2、allkeys-lru : 删除lru算法的key
    3、volatile-random:随机删除即将过期key
    4、allkeys-random:随机删除
    5、volatile-ttl : 删除即将过期的
    6、noeviction : 永不过期,返回错误

9.APPEND ONLY MODE。aof配置

# 默认是不开启aof模式的,默认是使用rdb模式持久化。大部分情况下,rdb完全够用
appendonly no
# appendfsync always # 每次修改都会sync,消耗性能。
appendfsync everysec # 每秒执行一次sync,可能会丢失这一秒数据。
# appendfsync no     # 不执行,这个时候操作系统自己同步数据,速度最快

九、redis的持久化

面试和工作,持久化都是重点!
Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以Redis提供了持久化功能!

1.RDB(Redis Database)

什么是rdb

redis数据量级别 redis数据量支持多大_redis数据量级别_07

在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置!
有时候在生产环境我们会将这个文件进行备份。
rdb保存的文件是dump.rdb。都是在我们的配置文件中快照中进行配置的!

触发机制

  1. save的规则满足的情况下,会自动触发rdb规则!
  2. 执行flushall 命令,也会触发我们的rdb规则!
  3. 退出redis,也会产生rdb文件!
    备份完成后就会生成一个dump.rdb文件

如何恢复rdb文件

  1. 只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb恢复其中的数据!
  2. 查看rdb文件需要存放的位置。
127.0.0.1:6379> config get dir
1) "dir"
2) "/etc" # 如果在这个目录下存在dump.rdb文件,启动就会自动恢复其中的数据

几乎就他自己默认的配置就够用了,但是我们还是需要去学习!

优点:

  1. 适合大规模的数据恢复!
  2. 要求:对数据的完整性不高!

缺点:

  1. 需要一定的时间间隔进程操作!如果redis意外宕机了,这个最后一次修改数据就没有了!
  2. fork进程的时候,会占用一定的内存空间!

2.AOF(append only file)

将我们的所有命令都记录下来,history,恢复的时候就把这个文件全部再执行。

redis数据量级别 redis数据量支持多大_redis数据量级别_08

以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

Aof保存的是appendonly.aof文件。

append

redis数据量级别 redis数据量支持多大_redis数据量级别_09

默认是不开启的,我们需要手动进行配置!我们只需要将appendonly改为yes就开启了aof!
重启,redis 就可以生效了!
如果这个aof文件有错误,这时候redis 是启动不起来的吗,我们需要修复这个aof文件redis 给我们提供了一个工具redis-check-aof - -fix

如果文件正常,重启就可以直接恢复了!

重写规则说明

aof默认就是文件的无限追加,文件会越来越大!

redis数据量级别 redis数据量支持多大_数据_10

如果aof文件大于64mb,太大了!fork一个新的进程来将我们的文件进行重写!

优点和缺点

# 默认是不开启aof模式的,默认是使用rdb模式持久化。大部分情况下,rdb完全够用
appendonly no
# appendfsync always # 每次修改都会sync,消耗性能。
appendfsync everysec # 每秒执行一次sync,可能会丢失这一秒数据。
# appendfsync no     # 不执行,这个时候操作系统自己同步数据,速度最快

优点:

  1. 每一次修改都同步,文件的完整会更加好!
  2. 每秒同步一次,可能会丢失一秒的数据
  3. 从不同步,效率最高的!

缺点:

  1. 相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢!
  2. Aof运行效率也要比rdb慢,所以我们redis默认的配置就是rdb持久化!

扩展

  1. RDB持久化方式能够在指定的时间间隔内对你的数据进行快照存储
  2. AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大。
  3. 只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化。
  4. 同时开启两种持久化方式
  • 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
  • RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。
  1. 性能建议
  • 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则。
  • 如果Enable AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的I0,二是AOF rewrite的最后将 rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
  • 如果不Enable AOF,仅靠Master-Slave Replcation实现高可用性也可以,能省掉一大笔lO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave中的RDB文件,载入较新的那个,微博就是这种架构。

十、redis的订阅发布

1.发布订阅模型

Redis 发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。
Redis 客户端可以订阅任意数量的频道。
订阅/发布消息图:
第一个:消息发送者,第二个:频道,第三个:消息订阅者!

redis数据量级别 redis数据量支持多大_nosql_11

下图展示了频道channel1,以及订阅这个频道的三个客户端——client2、client5和client1之间的关系:

当有新消息通过PUBLISH命令发送给频道channel1时,这个消息就会被发送给订阅它的三个客户端:

2.命令

这些命令被广泛用于构建即时通信应用,比如网络聊天室(chatroom)和实时广播!实时提醒等。

redis数据量级别 redis数据量支持多大_数据_12

3.测试

订阅段:

127.0.0.1:6379> subscribe kuangshenshuo # 订阅一个频道,名字叫kuangshenshuo
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "kuangshenshuo"
3) (integer) 1
# 等待读取发布的消息
1) "message" # 接收的是什么。消息
2) "kuangshenshuo" # 读取哪个频道的消息。kuangshenshuo
3) "hello,kuangshen" # 消息的具体内容。文章或者对象
1) "message"
2) "kuangshenshuo"
3) "hello,redis"

发布端:

# 发布者发布消息到频道kuangshenshuo
127.0.0.1:6379> publish kuangshenshuo "hello,kuangshen"
(integer) 1
# 发布者发布消息到频道kuangshenshuo
127.0.0.1:6379> publish kuangshenshuo "hello,redis"
(integer) 1

4.原理

Redis是使用C实现的,通过分析Redis源码里的pubsub.c文件,了解发布和订阅机制的底层实现,籍此加深对Redis的理解。
Redis通过PUBLISH、SUBSCRIBE和PSUBSCRIBE等命令实现发布和订阅功能。
微信公众号:
通过SUBSCRIBE命令订阅某频道后,redis-server里维护了一个字典,字典的键就是一个个channel,而字典的值则是一个链表,链表中保存了所有订阅这个channel的客户端。SUBSCRIBE命令的关键,就是将客户端添加到给定channel的订阅链表中。

redis数据量级别 redis数据量支持多大_数据_13

通过PUBLISH命令向订阅者发送消息,redis-server会使用给定的频道作为键,在它所维护的channel字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。

Pub/Sub从字面上理解就是发布(Publish)与订阅(Subscribe),在Redis中,你可以设定对某一个key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。

5.使用场景

  1. 实时消息系统!
  2. 实时聊天!(频道当做聊天室,将信息回显给所有人即可!)
  3. 订阅,关注系统都是可以的!

稍微复杂的场景我们就会使用消息中间件MQ!

十一、redis主从复制

1.概念

主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。

  • 前者称为主节点(master/leader),后者称为从节点(slave/follower)。
  • 数据的复制是单向的,只能由主节点到从节点。
  • Master以写为主,Slave以读为主。

默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。

2.主从复制作用

  1. 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
  2. 故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
  3. 负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
  4. 高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

数据冗余:在网络托管中,数据冗余是一种策略,确保您永远不会失去任何数据。
备份:是现有数据的重复拷贝。
冗余,不仅仅是复制数据;它是一个积极主动的行动计划,设计这个计划是为了您永远不会丢失数据。备份是整个冗余计划的一部分。

3.Redis运用于工程项目中

一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的,原因如下:

  1. 从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大.
  2. 从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。

电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是“多读少写”。
对于这种场景,我们可以使如下这种架构:

redis数据量级别 redis数据量支持多大_nosql_14

主从复制,读写分离!80%的情况下都是在进行读操作!减缓服务器的压力!架构中经常使用!

4.环境配置步骤

  1. 只配置从库,不用配置主库。
127.0.0.1:6379> info replication # 查看当前库的信息
# Replication
role:master # 角色 master
connected_slaves:0 # 连接的从机数量
master_replid:277688e672427068ab18c2bb9d239c776a402874
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
  1. 复制3个配置文件,然后修改对应的信息。
  • 端口
  • pid名字
  • log文件名字。6379.log
  • dump.rdb名字
  1. 启动redis。
    修改完毕之后,启动我们的3个redis服务器,可以通过进程信息查看。
# 启动命令
redis-server redis6379.conf
redis-server redis6380.conf
redis-server redis6381.conf
# 进程查看
ps -ef|grep redis

redis数据量级别 redis数据量支持多大_nosql_15

5.一主二从

默认情况下,每台Redis服务器都是主节点;我们一般情况下只用配置从机就好了!
认老大!一主(6379)二从(6380,6381)。从机认主机当老大

配置从机

127.0.0.1:6380> slaveof 127.0.0.1 6379 # slaveof 主机地址 端口号,找谁当老大
OK
127.0.0.1:6380> info replication
# Replication
role:slave # 当前角色是从机
master_host:127.0.0.1 # 可以看到主机的信息
master_port:6379
master_link_status:up
master_last_io_seconds_ago:3
master_sync_in_progress:0
slave_repl_offset:14
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:e700a386c850303c045de2c5223947da75490c74
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:14
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:14

在主机中查看

# 配置从机之前的信息
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:0
master_replid:2f5f0dbe824198d52ee1da8228368c158fc86cab
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
# 配置从机之后的信息
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:1 # 多了从机的配置信息
slave0:ip=127.0.0.1,port=6380,state=online,offset=56,lag=1
master_replid:e700a386c850303c045de2c5223947da75490c74
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:56
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:56

两个从机都配置完成

如果两个都配置完了,就是有两个从机的信息

redis数据量级别 redis数据量支持多大_数据库_16

真实环境的从主配置应该在配置文件中配置,这样的话是永久的,我们这里使用的是命令,只是暂时的!配置文件配置在上面第八个标题。

6.细节

主机可以写,从机不能写只能读!主机中的所有信息和数据,都会自动被从机保存!
 

redis数据量级别 redis数据量支持多大_redis_17

测试:

  1. 主机断开连接,从机依旧会连接到主机,但是没有写操作,这个时候,如果主机回来了,继续写数据,从机依旧可以直接获取到主机写的信息。(无论命令行还是配置文件配置的主从都是这样)
  2. 如果是使用命令行来配置的主从,这个时候从机如果重启了,就会变回主机!但是使用命令行让他再次连接主机,就会立即从主机获取值。(只要变为从机,立马就会从主机中获取值)
    (如果是配置文件配置的主从,从机重启后立即会从主机获取值)

复制原理

Slave启动成功连接到master后会发送一个sync同步命令,Master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。
全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。
增量复制:Master继续将新的所有收集到的修改命令依次传给slave,完成同步但是只要是重新连接master,一次完全同步(全量复制)将被自动执行!我们的数据一定可以在从机中看到!

7.宕机后手动配置主机

层层链路(狂神自己取的名字)

上一个Master链接下一个Slave!此时的80依旧是从节点,不能进行写操作。

redis数据量级别 redis数据量支持多大_redis_18

这个模型也能完成我们的主从复制。

如果没有老大了,这个时候能不能选择一个老大出来呢?手动设置!

谋朝篡位
如果主机断开了连接,我们可以使用SLAVEOF no one命令让自己变成主机!其他的节点就可以手动连接到最新的这个主节点(手动)!如果这个时候老大修复了,老大就变成光杆司令了,需要重新连接!

8.哨兵模式(重点)。面试和实战都会用得到

(自动选举老大的模式)
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。
Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题。
谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。

redis数据量级别 redis数据量支持多大_数据_19

这里的哨兵有两个作用

  • 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
  • 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。

然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

redis数据量级别 redis数据量支持多大_redis数据量级别_20

假设主服务器宕机,峭兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线。

测试

我们目前的状态是一主二从!
1、配置哨兵配置文件 sentinel.conf

#sentinel monitor 被监控的名称 host port 1
sentinel monitor myredis 127.0.0.1 6379 1

后面的这个数字1,代表主机挂了,slave投票看让谁接替成为主机,票数最多的,就会成为主机!

[root@iZbp13qr3mm4ucsjumrlgqZ bin]# redis-sentinel sentinel.conf
30668:X 25 Dec 2021 20:45:35.397 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
30668:X 25 Dec 2021 20:45:35.397 # Redis version=5.0.8, bits=64, commit=00000000, modified=0, pid=30668, just started
30668:X 25 Dec 2021 20:45:35.397 # Configuration loaded
                _._
           _.-``__ ''-._
      _.-``    `.  `_.  ''-._           Redis 5.0.8 (00000000/0) 64 bit
  .-`` .-```.  ```\/    _.,_ ''-._
 (    '      ,       .-`  | `,    )     Running in sentinel mode
 |`-._`-...-` __...-.``-._|'` _.-'|     Port: 26379
 |    `-._   `._    /     _.-'    |     PID: 30668
  `-._    `-._  `-./  _.-'    _.-'
 |`-._`-._    `-.__.-'    _.-'_.-'|
 |    `-._`-._        _.-'_.-'    |           http://redis.io
  `-._    `-._`-.__.-'_.-'    _.-'
 |`-._`-._    `-.__.-'    _.-'_.-'|
 |    `-._`-._        _.-'_.-'    |
  `-._    `-._`-.__.-'_.-'    _.-'
      `-._    `-.__.-'    _.-'
          `-._        _.-'
              `-.__.-'
30668:X 25 Dec 2021 20:45:35.398 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
30668:X 25 Dec 2021 20:45:35.398 # Sentinel ID is a9e1a9362fc71d274e27a7c1d5a49018016fdf58
30668:X 25 Dec 2021 20:45:35.398 # +monitor master myredis 127.0.0.1 6379 quorum 1
30668:X 25 Dec 2021 20:45:35.400 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
30668:X 25 Dec 2021 20:45:35.401 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379

如果Master 节点断开了,这个时候就会从从机中随机选择一个服务器!(这里面有一个投票算法!)

redis数据量级别 redis数据量支持多大_redis数据量级别_21

哨兵日志:

如果主机此时回来了,只能归并到新的主机下,当做从机,这就是哨兵模式的规则!
 

哨兵模式

优点:

  1. 哨兵集群,基于主从复制模式,所有的主从配置优点,它全有。
  2. 主从可以切换,故障可以转移,系统的可用性就会更好。
  3. 哨兵模式就是主从模式的升级,手动到自动,更加健壮。

缺点:

  1. Redis不好在线扩容的,集群容量一旦到达上限,在线扩容就十分麻烦。
  2. 实现哨兵模式的配置其实是很麻烦的,里面有很多选择。

哨兵模式的全部配置



  1. ...

十二、redis缓存穿透和雪崩(面试高频,工作常用高频)

服务的高可用问题

Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中,最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。目前,业界也都有比较流行的解决方案。

redis数据量级别 redis数据量支持多大_redis数据量级别_22

1.缓存穿透(查不到)

概念

缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中(秒杀场景),于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。

解决方案

  1. 布隆过滤器
    布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;
  2. 缓存空对象
    当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源;

但是这种方法会存在两个问题:

  1. 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键;
  2. 即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。

2.缓存击穿(访问量太大,缓存过期)

访问量太大,缓存过期,在缓存过期的空档期,所有的访问砸在了MySQL服务器上,导致服务器宕机。

概述

这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。

解决方案

  1. 设置热点数据永不过期
    从缓存层面来看,没有设置过期时间,所以不会出现热点key过期后产生的问题。
  2. 加互斥锁
    分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。

3.缓存雪崩

概念

缓存雪崩,是指在某一个时间段,缓存集中过期失效。redis宕机!
产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

redis数据量级别 redis数据量支持多大_redis_23

其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。

解决方案

  1. redis高可用
    这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。(异地多活!)
  2. 限流降级(在springClound课程讲解过!)
    这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
  3. 数据预热
    数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。