一、MongoDB概述

1、mongoDB概述

MongoDB 是一个基于分布式文件存储的数据库。由C++语言编写

2、NoSQL概述

NoSQL,指的是非关系型的数据库。NoSQL 有时也称作Not Only SQL 的缩写,
是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL 用于超大规模数据的存储

3、关系数据库对比非关系数据库

关系型数据库                                           NoSQL 数据库
高度组织化结构化数据                             代表着不仅仅是SQL
结构化查询语言(SQL)                         没有声明性查询语言
数据和关系都存储在单独的表中               没有预定义的模式
数据操作语言,数据定义语言                   键-值对存储,列存储,文档存储,图形数据库
严格的一致性                                           最终一致性,而非ACID 属性
基础事务                                                  非结构化和不可预知的数据
                                                                 CAP 定理
                                                                   高性能,高可用性和可伸缩性

4、NoSQL数据库分类

列存储:Hbase/Cassandra

文档存储:MongoDB/CounchDB

key-value存储:Redis/Memcache

图存储:Neo4j/FlockDB

对象存储:Db4o

XML数据库:BaseX

5、CAP原则
CAP 定理(CAP theorem), 又被称作布鲁尔定理(Brewer's theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点:

一致性(Consistency) (所有节点在同一时间具有相同的数据)
可用性(Availability) (保证每个请求不管成功或者失败都有响应)
分区容错性(Partition tolerance) (系统中任意信息的丢失或失败不影响系统的继续运行)

CAP 理论的核心是:

一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个

根据CAP 原理将NoSQL 数据库分成了满足CA 原则、满足CP 原则和满足AP 原则三大类:

CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
CP - 满足一致性,分区容错性的系统,通常性能不是特别高。
AP - 满足可用性,分区容错性的系统,通常可能对一致性要求低一些。

二、MongoDB体系结构

关系数据库

MongoDB

解释对比

Database

Database

数据库/数据库

Table

Collection

数据库表/集合

Row

Document

数据库记录行/文档

Column

Field

数据列/数据字段

Index

Index

索引/索引

Table join

 

表关联/MongoDB不支持

Primary key

Object ID

主键/MongoDB自动将_id设为主键

 

三、MongoDB数据类型

BSON

BSON( Binary Serialized Document Format) 是一种二进制形式的存储格式,
采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的特点

01.MongoDB基本概念和原理_数据库

01.MongoDB基本概念和原理_数据_02

四、MongoDB底层原理

MongoDB 的集群部署方案中有三类角色:

实际数据存储结点、配置文件存储结点和路由接入结点。

MongDB客户端访问过程:

连接的客户端直接与路由结点相连,从配置结点上查询数据,根据查询结果到实际的存储结点上查询和存储数据。

MongoDB 的部署方案:

单机部署、复本集(主备)部署、分片部署、复本集与分片混合部署。

1、混合的部署方式如下图:

01.MongoDB基本概念和原理_结点_03

混合部署方式下向MongoDB 写数据的流程如图:

01.MongoDB基本概念和原理_MongoDB基本概念和原理_04

混合部署方式下读MongoDB 里的数据流程如图:

01.MongoDB基本概念和原理_MongoDB基本概念和原理_05

2、复本集、

又有主和从两种角色,写数据和读数据也是不同,写数据的过程是只写到主结点中,由主结点以异步的方式同步到从结点中

下面是写数据图示:

01.MongoDB基本概念和原理_数据库_06

读数据则只要从任一结点中读取,具体到哪个结点读取是可以指定的、图示如下:

01.MongoDB基本概念和原理_MongoDB基本概念和原理_07

MongoDB 的分片:

分片(sharding)是将数据拆分,将其分散存到不同机器上的过程。MongoDB 支持自动分片,
可以使数据库架构对应用程序不可见。对于应用程序来说,好像始终在使用一个单机的 MongoDB 服务器一样,
另一方面,MongoDB 自动处理数据在分片上的分布,也更容易添加和删除分片。

假设我们以某一索引键(ID)为片键,ID 的区间[0,50],划分成5 个chunk,分别存储到3 个片服务器中,如图所示:

01.MongoDB基本概念和原理_MongoDB基本概念和原理_08

MongoDB配置结点:(保存集群和分片的元数据)


 存储配置文件的服务器其实存储的是片键与chunk 以及chunk 与server 的映射关系,用上面的数据表示的配置结点存储的数据模型如下表:


01.MongoDB基本概念和原理_MongoDB基本概念和原理_09

 MongoDB路由结点:

路由角色的结点在分片的情况下起到负载均衡的作用。

五、MongoDB应用场景

1、网站实时数据量大

2、数据读写都很频繁

3、价值较低