BASE 和最终一致性
ACID 是关系型数据库的四个性质,在 NoSql 数据库中 BASE 和 ACID 对应
1、基本可用
允许分区失败情况出现
在数据库部署中有一两个节点出现失败
2、软状态
硬状态
一直保持数据库一致性
任意时刻数据必须正确
软状态
状态可以有一段时间不同步,具有一定的滞后性
3、最终一致性
强一致性
写入数据,能保证马上拿到更新后的数据
弱一致性
写入数据,不能保证马上拿到更新后的数据
最终一致性是“弱一致性”的特例,最终能保证数据的一致性
最终一致性,根据各进程访问到数据的时间和方式不同,区分为
因果一致性
A 通知 B 更新了一项,那么 B 的后续访问使用 A 的最新值
“读自己的写入”
A 更新后,它总可以访问更新的值,不会看到旧值
“单调读一致性”
如果进程以及看到对象的某个值,那么后续访问都不会返回那个值之前的值
“会话一致性”
把访问存储系统的这些进程,放到会话的上下文进程中。只要会话存在,就可以保证“读自己的写入”一致性
“单调写一致性”,一般要保证
系统需要保证来自同一个进程的写操作按顺序进行
- 保证高性能,高可用,高可扩展性
为什么要使用Nosql
- 这就要从历史的演进说起
单体mysql结构
- 一个app直接通过dal数据访问层到mysql中进行数据处理, 当网站访问量不大的时候,单个数据库足够
- 当一个mysql数据库数据达到300万上就必须加索引(B+Tree)但是如果再多的话机器就会出现下述问题
- 内存放不下这么多数据
- 访问量太大(并且是读写混合), 一个服务器承受不了
- 只要发生上述发生任何一个问题,都必需晋级
Memcached内存缓存+mysql+垂直拆分(读写分离)
- 将数据库多准备几个自然存储容量就大了
- 将读写数据库服务分开,并且减轻数据库查询的压力,就加一层缓存,所以也就保存了一定的效率
- 但是随着数据量的再次增加, 垂直拆分的效率已经满足不了此时的数据处理只能再次增加服务器,但是每个功能服务器太多就会有很多额外的麻烦事 不方便管理,就引入集群的概念
分库分表 + 水平拆分(集群)
- 分库分表意思就好比将user表,订单表,放到不同的数据库集群上
- 分表之后处理的就不是一张表,以为我们在处理数据库的一张表的时候使用Innodb引擎, 他是给行上锁, 但是即使是给行上锁那么多数据请求还是有很多请求是在处理一行数据, 这时效率就下来了,就不得不使用分库分表了
- 集群就是将某一个功能模块的服务器放到一起,就像拉一个群一样,放着很多处理一样请求的服务器,这样数据处理起来更加专注,通知管理起来也是更加方便
- 但是随着发展,现在时代不仅仅是数据量的庞大, 不仅仅是大数据, 更是快刷新时代和高并发时代,比如我么的抖音,每天上亿活跃用户, 还在不断加载视频等数据, 还有大量的直播数据, 关系型数据库就力不从心了, 就必须引入能够实现高刷新的Nosql
高效率的Nosql
- 用户的信息,社交网络上的信息,地址位置,用户产生的数据,用户日志等数据的爆发增长,这时候就必须使用Nosql
- Nosql意思是Not only sql 不仅仅是sql
- Nosql泛指非关系型数据库,传统的关系型数据库对应现在的超大规模的并发量和超大规模的数据刷新量,是很难对付的,所以Nosql对于当今时代的发展非常重要:Redis是发展最快的
- 使用Nosql可以缓解大数据时代的3V和3高, 3V是海量.多样,实时,3高是高并发,高扩展,高性能
- 但是在实践中:一定是RDBMS和Nosql一起使用的,才是最强的
Nosql的四大分类
1 键值数据库
相关产品:Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached
应用:内容缓存
优点:扩展性好、灵活性好、大量写操作时性能高
缺点:无法存储结构化信息、条件查询效率较低
使用者:百度云(Redis)、GitHub(Riak)、BestBuy(Riak)、Twitter(Ridis和Memcached)
2 列族数据库
相关产品:BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS
应用:分布式数据存储与管理
优点:查找速度快、可扩展性强、容易进行分布式扩展、复杂性低
使用者:Ebay(Cassandra)、Instagram(Cassandra)、NASA(Cassandra)、Facebook(HBase)
3 文档数据库
相关产品:MongoDB、CouchDB、ThruDB、CloudKit、Perservere、Jackrabbit、Bson
- bson(和json类似, 但是是以二进制形式存储)和MongoDB(基于分布式文件存储的数据库,c++编写), 主要用来存储大量文档, 并且MongoDB是基于RDBMS和Nosql的中间,是Nosql中最像关系型的数据库
应用:存储、索引并管理面向文档的数据或者类似的半结构化数据
优点:性能好、灵活性高、复杂性低、数据结构灵活
缺点:缺乏统一的查询语言
使用者:百度云数据库(MongoDB)、SAP(MongoDB)
4 图形数据库
相关产品:Neo4J、OrientDB、InfoGrid、GraphDB
- 它不是存储图片的, 是存储关系的,比如社交朋友圈, 广告推送, 主流技术就是Neo4j和InfoGrid
总结