MongoDB 中的应用场景及设计原理

基于分布式文件存储的数据库。由 C++ 语言编写。在高负载的情况下,添加更多的节点,可以保证服务器性能。MongoDB的出现,旨在为 WEB 应用提供 ①可扩展的 高性能 数据存储解决方案。

       MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。接下来简单介绍一下非关系型数据库(NoSQL)

1.1、什么是NoSQL

       NoSQL,指的是非关系型的数据库。NoSQL 有时也称作Not Only SQL 的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL 用于超大规模数据的存储。(例如谷歌或Facebook 每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。

1.2、NoSQL的优缺点

优点

缺点

1.高可扩展性

1.没有标准化

2.分布式计算

2.有限的查询功能

3.低成本

3.最终一致是不直观的程序

4.架构的灵活性,半结构化数据

 

5.没有复杂的关系

 

1.3、关系型数据库 PK 非关系型数据库

RDBMS 关系型数据

NoSQL 数据库

高度组织化结构化数据

代表着不仅仅是SQL

结构化查询语言(SQL) 

没有声明性查询语言

数据和关系都存储在单独的表中。

没有预定义的模式

数据操纵语言,数据定义语言

键 - 值对存储,列存储,文档存储,图形数据库

严格的一致性

最终一致性,而非 ACID 属性

基础事务

非结构化和不可预知的数据

 

CAP定理

 

高性能,高可用性和可伸缩性

1.4、NoSQL 数据库分类

类型

部分代表

特点

列存储

Hbase

Cassandra

Hypertable

顾名思义,是按列存储数据的。最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的IO优势。

文档存储

MongoDB

CouchDB

文档存储一般用类似json的格式存储,存储的内容是文档型的。这样也就有机会对某些字段建立索引,实现关系数据库的某些功能。

key-value存储

Tokyo Cabinet / Tyrant

Berkeley DB

MemcacheDB

Redis

可以通过key快速查询到其value。一般来说,存储不管value的格式,照单全收。(Redis包含了其他功能)

图存储

Neo4J

FlockDB

图形关系的最佳存储。使用传统关系数据库来解决的话性能低下,而且设计使用不方便。

对象存储

db4o

Versant

通过类似面向对象语言的语法操作数据库,通过对象的方式存取数据。

xml数据库

Berkeley DB XML

BaseX

高效的存储XML数据,并支持XML的内部查询语法,比如XQuery,Xpath。

1.5、MongoDB 的数据结构与关系型数据库数据结构对比

关系型数据库术语

概念MongoDB 术语

概念解释/说明

Database

Database

数据库

Table

Collection

数据库表/集合

Row

Document

数据记录行/文档

Column

Field

数据列/数据字段

Index

Index

索引

Table joins

 

表关联/MongoDB 不支持

Primary Key

Object ID

主键/MongoDB 自动将_id 设置为主键

1.6、MongoDB 中的数据类型

数据类型

说明

解释

举例

Null

空值

表示空值或者未定义的对象

{“x”:null}

Boolean

布尔值

真或者假: true 或者 false

{“x”:true}

Integer

整数

整型数值。用于存储数值。根据你所采用的服务器,可分为32 位或64位。

 

Double

浮点数

双精度浮点值。

{“x”:3.14,”y”:3}

String

字符串

UTF-8 字符串

 

Symbol

符号

符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。

 

ObjectID

对象ID

对象ID。用于创建文档的ID。

{“id”: ObjectId()}

Date

日期

日期时间。用UNIX 时间格式来存储当前日期或时间。

{“date”:new Date()}

Timestamp

时间戳

从标准纪元开始的毫秒数

 

Regular

正则表达式

文档中可以包含正则表达式,遵循 JavaScript 的语法

{“foo”:/testdb/i}

Code

代码

可以包含JavaScript代码

{“x”:function() {}}

Undefined

未定义

已废弃

 

Array

数组

值的集合或者列表

{“arr”: [“a”,”b”]}

Binary Data

二进制

用于存储二进制数据。

 

Object

内嵌文档

文档可以作为文档中某个key 的value

{“x”:{“foo”:”bar”}}

Min/Max keys

最小/大值

将一个值与BSON(二进制的JSON)元素的最低值和最高值相对比。

 

1.7、MongoDB 的应用场景和不适用场景

1)适用场景如下:

 

1)网站实时数据:MongoDB 非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。

2)数据缓存:由于性能很高,MongoDB 也适合作为信息基础设施的缓存层。在系统重启之后,由MongoDB搭建的持久化缓存层可以避免下层的数据源过载。

3)大尺寸、低价值数据存储:使用传统的关系型数据库存储一些数据时可能会比较昂贵,在此之前,很多时候程序员往往会选择传统的文件进行存储。

4)高伸缩性场景:MongoDB 非常适合由数十或数百台服务器组成的数据库。MongoDB 的路线图中已经包含对MapReduce 引擎的内置支持。

5)对象或JSON 数据存储:MongoDB 的BSON 数据格式非常适合文档化格式的存储及查询。

2)不适用场景如下:

1)高度事务性系统:例如银行或会计系统。传统的关系型数据库目前还是更适用于需要大量原子性复杂事务的应用程序。

2)传统的商业智能应用:针对特定问题的BI 数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。

3)需要复杂SQL 查询的问题。


MongoDB基础,介绍到此为止