1. 简介
MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。
1.1. 特点
它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:
- 面向集合存储,易存储对象类型的数据。
- 模式自由。
- 支持动态查询。
- 支持完全索引,包含内部对象。
- 支持查询。
- 支持复制和故障恢复。
- 使用高效的二进制数据存储,包括大型对象(如视频等)。
- 自动处理碎片,以支持云计算层次的扩展性。
- 支持 Golang,RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
- 文件存储格式为BSON(一种JSON的扩展)。
- 可通过网络访问。
1.2. 使用原理
所谓“面向集合”(Collection-Oriented),意思是数据被分组存储在数据集中,被称为一个集合(Collection)。每个集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。集合的概念类似关系型数据库(RDBMS)里的表(table),不同的是它不需要定义任何模式(schema)。Nytro MegaRAID技术中的闪存高速缓存算法,能够快速识别数据库内大数据集中的热数据,提供一致的性能改进。
模式自由(schema-free),意味着对于存储在mongodb数据库中的文件,我们不需要知道它的任何结构定义。如果需要的话,你完全可以把不同结构的文件存储在同一个数据库里。
存储在集合中的文档,被存储为键-值对的形式。键用于唯一标识一个文档,为字符串类型,而值则可以是各种复杂的文件类型。我们称这种存储形式为BSON(Binary Serialized Document Format)。
1.3. 问答简介
- 什么是MongoDB?
- 一个以JSON为数据模型的文档数据库
- 为什么叫文档数据库?
- 文档来自于
JSON Document
,并非我们一般理解的PDF,Word文档
- 谁开发了MongoDB?
- 公司MongoDB Inc,美国
- 主要用途
- 应用数据库,类似于Oracle,MySql,海量数据处理,数据平台
- 主要特点
- JSON数据模型比较合适开发者
- 横向扩展可以支撑很大数据量和并发
- MongoDB是免费的吗?
- MongoDB有两个发布版本:社区版和企业版
- 社区版基于SSPL,一种和AGPL类似的开源协议
- 企业版是基于商业协议,需要付费使用
2. MongDB版本变迁历史
- 0.x
2008年:起步阶段 - 1.x
2010年:支持复制集和分片集 - 2.x
2012年:跟丰富的数据库功能 - 3.x
2014年-WiredTiger和周边生态环境 - 4.x
2018年-分布式事务支持
3. 对比关系型数据的概念
MongoDB | 关系型数据库 |
数据库 | 数据库 |
集合 | 数据表 |
文档 | 数据行 |
MongoDB | 关系型数据库 | |
数据模型 | 文档模型 | 关系模型 |
数据库类型 | OLTP | OLTP |
CRUD操作 | MQL/SQL | SQL |
高可用 | 复制集 | 集群模式 |
横向扩展能力 | 通过原生分片完善支持 | 数据分区或者应用侵入式 |
索引支持 | B-树,全文索引,地理位置索引,多键(multikey)索引,TTL索引 | 多种索引 |
开发难度 | 容易 | 困难 |
数据容量 | 没有理论上限 | 千万,亿 |
扩展方式 | 垂直扩展+水平扩展 | 垂直扩展 |
Sql术语概念 | MongoDB术语概念 | 说明 |
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | 表连接/MongoDB不支持 | |
嵌入文档 | 通过嵌入文档代替多表连接 | |
primary key | primary key | 主键,MongoDB自动将_id作为主键 |
4. 数据模型
MongoDB的最小存储单位就是文档(documnet)对象。文档(document)对象对应于关系型数据库的行。数据在MongoDB中以BSON(Binart-JSON)文档的格式存储在磁盘上。
BSON(Binart Serialized DocumentFormat)是一种类Json的一种二进制形式的存储格式,简称BinaryJSON。BSON和JSON一样,支持内嵌的文档数据和数组对象,但是BSON有JSON没有的一些数据类型,如Data和BinData类型。
BSON采用了类似于C语言结构体的名称、对表示方式,支持内嵌对象和数组对象,具有轻量性、课遍历性、高效性的三个特点,可以有效描述非结构化数据和结构化数据。这种格式的有点是灵活性高,但它的缺点是空间利用率不是很理想。
BSON中,除了基本的JSON类型:string,integer,boolean,double,null,array和object,MongoDB还使用了特殊的数据类型。这些类型包括date,object id,binary data,regular expression和code。每一个驱动都以特定语言的方式实现了这些类型。
5. 使用场景
- 游戏场景:使用MongoDB存储游戏用户信息,用户的装备,积分等直接以内嵌文档的形式存储,方便查询、更新
- 物流场景:使用MongoDB存储订单信息,订单状态在运送过程中不断更新,以MongoDB内嵌数组的方式来存储,一次查询就能将订单所有的变更读取出来
- 社交场景:使用MongoDB存储用户信息,以及用户发表的朋友圈信息,通过地理位置索引实现附近的人、地点等功能。
- 物联网场景:使用MongoDB存储所有接入的智能设备信息,以及设备汇报的日志信息,并对这些信息进行多维度的分析、
- 直播视频,使用MongoDB存储用户信息、礼物信息等。
6. 技术选型依据
- 应用不需要事务以及复杂的Join支持
- 新应用,需求汇编,数据模型无法确定,想快速开发
- 应用需要2000-3000以上的读写QPS
- 应用需要TB甚至PB级别数据存储
- 应用发展迅速,需要能快速水平扩展
- 应用要求存储的数据不丢失
- 应用需要99.999%高可用
- 应用需要大量的地理位置查询、文本查询
7. 学习社区地址
- 官网:https://www.mongodb.com/
- 中文社区:https://mongoing.com/
- 菜鸟教程:https://www.runoob.com/mongodb/mongodb-tutorial.html