一、概述
MongoDB 是一个基于分布式文件存储的数据库。由C++ 语言编写。旨在为WEB 应用提供可扩展的高性能数据存储解决方案。它是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。采用类似json格式的bson格式存储数据,存储的内容是文档型的。
二、NoSQL和RDBMS
(1)NoSQL(Not Only SQL),指的是非关系型数据库,是对不同于传统的关系型数据库的数据库管理系统的统称。如Redis。NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。
(2)RDBMS :指的是关系型数据库系统的统称,在关系型数据库中数据是以行,列的形式存储在表中的,如MySQL,Oracle。
非关系型与关系型数据库的比较如下:
RDBMS
- 高度组织化结构化数据;
- 结构化查询语(SQL);
- 数据和关系都存储在单独的表中;
- 数据操纵语言,数据定义语言;
- 基础事务。
NoSQL
- 代表着不仅仅是SQL;
- 没有声明性查询语言;
- 没有预定义的模式;
- 键 - 值对存储,列存储,文档存储(如MongoDB ),图形数据库;
- 最终一致性,而非ACID属性;
- 预知的数据;
- CAP定理;
- 高性能,高可用性和可伸缩性。
三、CAP和BASE定理
(1)CAP定理(CAP theorem)
在计算机科学中, CAP定理(CAP theorem), 又被称作 布鲁尔定理(Brewer's theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点:
- 一致性(Consistency) (所有节点在同一时间具有相同的数据)
- 可用性(Availability) (保证每个请求不管成功或者失败都有响应)
- 分隔容忍(Partition tolerance) (系统中任意信息的丢失或失败不会影响系统的继续运作)
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类:
- CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
- CP - 满足一致性,分区容忍性的系统,通常性能不是特别高。
- AP - 满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。
如下图所示:
(2)BASE理论
BASE:Basically Available, Soft-state, Eventually Consistent。 由 Eric Brewer 定义。
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
BASE是NoSQL数据库对可用性及一致性的弱要求原则:
- Basically Availble :基本可用
- Soft-state :软状态/柔性事务。 "Soft state" 可以理解为"无连接"的, 而 "Hard state" 是"面向连接"的
- Eventual Consistency :最终一致性, 也是 ACID 的最终目的。
四、NoSQL 数据库分类
五、学习MongoDB的网站资源
(1) 菜鸟教程:https://www.runoob.com/mongodb/mongodb-tutorial.html
(2)MongoDB中文网:https://www.mongodb.org.cn/
(4)MongoDB中文社区:https://mongoing.com/
(5)MongoDB官网:https://www.mongodb.com/try