1、业务应用场景

传统的关系型数据库(如MySQL),在数据操作的“三高”需求以及应对Web2.0的网站需求面前,显得力不从心。而MongoDB能很好的应对“三高”需求。

“三高”需求: 高并发、高性能、高可用;面向互联网的三高系统,最关注的是:性能、可用性、伸缩性、扩展性、安全性。

具体的应用场景如:

(1)社交场景,使用 MongoDB 存储存储用户信息,以及用户发表的朋友圈信息,通过地理位置索引实现附近的人、地点等功能。

(2)游戏场景,使用 MongoDB 存储游戏用户信息,用户的装备、积分等直接以内嵌文档的形式存储,方便查询、高效率存储和访问。

(3)物流场景,使用 MongoDB 存储订单信息,订单状态在运送过程中会不断更新,以 MongoDB 内嵌数组的形式来存储,一次查询就能将 订单所有的变更读取出来。

(4)视频直播,使用 MongoDB 存储用户信息、点赞互动信息等。

这些应用场景中,数据操作方面的共同特点是:

(1)数据量大

(2)写入操作频繁(读写都很频繁)

(3)价值较低的数据,对事务性要求不高

对于这样的数据,更适合使用MongoDB来实现数据的存储。

什么时候选择MongoDB 在架构选型上,除了上述的三个特点外,还可以考虑以下的一些问题:

(1)应用不需要事务及复杂 join 支持

(2)新应用,需求会变,数据模型无法确定,想快速迭代开发

(3)应用需要2000-3000以上的读写QPS(更高也可以)

(4)应用需要TB甚至 PB 级别数据存储

(5)应用发展迅速,需要能快速水平扩展

(6)应用要求存储的数据不丢失

(7)应用需要99.999%高可用

(8)应用需要大量的地理位置查询、文本查询

如果上述有1个符合,可以考虑 MongoDB,2个及以上的符合,选择 MongoDB 绝不会后悔。

相对MySQL,可以以更低的成本解决问题(包括学习、开发、运维等成本)

2、MongoDB简介

MongoDB是一个开源、高性能、无模式的文档型数据库,当初的设计就是用于简化开发和方便扩展,是NoSQL数据库产品中的一种。是最像关系型数据库(MySQL)的非关系型数据库。

它支持的数据结构非常松散,是一种类似于 JSON 的 格式叫BSON,所以它既可以存储比较复杂的数据类型,又相当的灵活。 MongoDB中的记录是一个文档,它是一个由字段和值对(field:value)组成的数据结构。MongoDB文档类似于JSON对象,即一个文档认为就是一个对象。字段的数据类型是字符型,它的值除了使用基本的一些类型外,还可以包括其他文档、普通数组和文档数组。

3、体系结构

MySQL和MongoDB对比

mongodb 社交平台架构 mongodb业务场景_MySQL

4、数据模型

MongoDB的最小存储单位就是文档(document)对象。数据在MongoDB中以 BSON(Binary-JSON)文档的格式存储在磁盘上。

BSON(Binary Serialized Document Format)是一种类json的一种二进制形式的存储格式,简称Binary JSON。BSON和JSON一样,支持内嵌的文档对象和数组对象,Bson中除了基本的JSON类型:string,integer,boolean,double,null,array和object,mongo还使用了特殊的数据类型date,object id,binary data,regular expression 和code。

BSON支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的三个特点,可以有效描述非结构化数据和结构化数据。这种格式的优点是灵活性高,但它的缺点是空间利用率不是很理想。

BSON数据类型参考列表:

mongodb 社交平台架构 mongodb业务场景_数据_02

5、MongoDB的特点

(1)高性能: MongoDB提供高性能的数据持久性。特别是, 对嵌入式数据模型的支持减少了数据库系统上的I/O活动。 索引支持更快的查询,并且可以包含来自嵌入式文档和数组的键。(文本索引解决搜索的需求、TTL索引解决历史数据自动过期的需求、地理位置索引可用于构建各种 O2O 应用) mmapv1、wiredtiger、mongorocks(rocksdb)、in-memory 等多引擎支持满足各种场景需求。 Gridfs解决文件存储的需求。

(2)高可用性: MongoDB的复制工具称为副本集(replica set),它可提供自动故障转移和数据冗余。

(3)高扩展性: MongoDB提供了水平可扩展性作为其核心功能的一部分。 分片将数据分布在一组集群的机器上(海量数据存储,服务能力水平扩展) 。

(4)丰富的查询支持: MongoDB支持丰富的查询语言,支持读和写操作(CRUD),比如数据聚合、文本搜索和地理空间查询等。

(5)其他特点:如无模式(动态模式)、灵活的文档模型。

6、事务与一致性

"不支持事务" 是 MongoDB 一直被诟病的问题,当然也可以说这是 NoSQL 数据库的一种权衡(放弃事务,追求高性能、高可扩展)。但实质上,MongoDB 很早就有事务的概念,但是这个事务只能是针对单文档的,即单个文档的操作是有原子性保证的。
在4.0 版本之后,MongoDB 开始支持多文档的事务:

  • 4.0 版本支持副本集范围的多文档事务。
  • 4.2 版本支持跨分片的多文档事务(基于两阶段提交)。

在事务的隔离性上,MongoDB 支持快照(snapshot)的隔离级别,可以避免脏读、不可重复读和幻读。

尽管有了真正意义上的事务功能,但多文档事务对于性能有一定的影响,应用应该在充分评估后再做选用。

单个Server是不支持使用事务,单个文档操作是原子操作,而mongodb是文档型数据库,在单个文档上,可以嵌入对象/数组这种格式来维护数据的关系,而不应该使用多个集合来维护数据之间的关系。由于mongodb的这种特性,所以单个文档操作消除了很多需要事务的需求。

7、与Mysql的区别

(1)mongoDB查询方式类似JavaScript的函数,而MySQL使用sql语句
(2)mongoDb仅支持单一文档事务,MySQL根据不同存储引擎来判断是否支持事务(innodb是支持事务的,myisam不支持事务)
(3)mongoDB不支持join操作

mongodb 社交平台架构 mongodb业务场景_数据库_03