NOsql数据库原理选择题 nosql数据库基本原理

转载

技术极先锋 2023-09-06 13:22:39

文章标签 NOsql数据库原理选择题 MongoDB 数据关系型数据库数据库 文章分类 NoSQL 数据库

MongoDB 中的应用场景及设计原理

基于分布式文件存储的数据库。由 C++ 语言编写。在高负载的情况下，添加更多的节点，可以保证服务器性能。MongoDB的出现，旨在为 WEB 应用提供 ①可扩展的 ②高性能 ③数据存储解决方案。

MongoDB 是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。接下来简单介绍一下非关系型数据库（NoSQL）

1.1、什么是NoSQL

NoSQL，指的是非关系型的数据库。NoSQL 有时也称作Not Only SQL 的缩写，是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL 用于超大规模数据的存储。（例如谷歌或Facebook 每天为他们的用户收集万亿比特的数据）。这些类型的数据存储不需要固定的模式，无需多余操作就可以横向扩展。

1.2、NoSQL的优缺点

优点	缺点
1.高可扩展性	1.没有标准化
2.分布式计算	2.有限的查询功能
3.低成本	3.最终一致是不直观的程序
4.架构的灵活性，半结构化数据
5.没有复杂的关系

1.3、关系型数据库 PK 非关系型数据库

RDBMS 关系型数据	NoSQL 数据库
高度组织化结构化数据	代表着不仅仅是SQL
结构化查询语言（SQL）	没有声明性查询语言
数据和关系都存储在单独的表中。	没有预定义的模式
数据操纵语言，数据定义语言	键 - 值对存储，列存储，文档存储，图形数据库
严格的一致性	最终一致性，而非 ACID 属性
基础事务	非结构化和不可预知的数据
	CAP定理
	高性能，高可用性和可伸缩性

1.4、NoSQL 数据库分类

类型	部分代表	特点
列存储	Hbase Cassandra Hypertable	顾名思义，是按列存储数据的。最大的特点是方便存储结构化和半结构化数据，方便做数据压缩，对针对某一列或者某几列的查询有非常大的IO优势。
文档存储	MongoDB CouchDB	文档存储一般用类似json的格式存储，存储的内容是文档型的。这样也就有机会对某些字段建立索引，实现关系数据库的某些功能。
key-value存储	Tokyo Cabinet / Tyrant Berkeley DB MemcacheDB Redis	可以通过key快速查询到其value。一般来说，存储不管value的格式，照单全收。（Redis包含了其他功能）
图存储	Neo4J FlockDB	图形关系的最佳存储。使用传统关系数据库来解决的话性能低下，而且设计使用不方便。
对象存储	db4o Versant	通过类似面向对象语言的语法操作数据库，通过对象的方式存取数据。
xml数据库	Berkeley DB XML BaseX	高效的存储XML数据，并支持XML的内部查询语法，比如XQuery,Xpath。

1.5、MongoDB 的数据结构与关系型数据库数据结构对比

关系型数据库术语	概念MongoDB 术语	概念解释/说明
Database	Database	数据库
Table	Collection	数据库表/集合
Row	Document	数据记录行/文档
Column	Field	数据列/数据字段
Index	Index	索引
Table joins		表关联/MongoDB 不支持
Primary Key	Object ID	主键/MongoDB 自动将_id 设置为主键

1.6、MongoDB 中的数据类型

数据类型	说明	解释	举例
Null	空值	表示空值或者未定义的对象	{“x”:null}
Boolean	布尔值	真或者假： true 或者 false	{“x”:true}
Integer	整数	整型数值。用于存储数值。根据你所采用的服务器，可分为32 位或64位。
Double	浮点数	双精度浮点值。	{“x”：3.14，”y”：3}
String	字符串	UTF-8 字符串
Symbol	符号	符号。该数据类型基本上等同于字符串类型，但不同的是，它一般用于采用特殊符号类型的语言。
ObjectID	对象ID	对象ID。用于创建文档的ID。	{“id”: ObjectId()}
Date	日期	日期时间。用UNIX 时间格式来存储当前日期或时间。	{“date”:new Date()}
Timestamp	时间戳	从标准纪元开始的毫秒数
Regular	正则表达式	文档中可以包含正则表达式，遵循 JavaScript 的语法	{“foo”:/testdb/i}
Code	代码	可以包含JavaScript代码	{“x”：function() {}}
Undefined	未定义	已废弃
Array	数组	值的集合或者列表	{“arr”: [“a”,”b”]}
Binary Data	二进制	用于存储二进制数据。
Object	内嵌文档	文档可以作为文档中某个key 的value	{“x”:{“foo”:”bar”}}
Min/Max keys	最小/大值	将一个值与BSON（二进制的JSON）元素的最低值和最高值相对比。

1.7、MongoDB 的应用场景和不适用场景

1）适用场景如下：

1）网站实时数据:MongoDB 非常适合实时的插入，更新与查询，并具备网站实时数据存储所需的复制及高度伸缩性。
2）数据缓存:由于性能很高，MongoDB 也适合作为信息基础设施的缓存层。在系统重启之后，由MongoDB搭建的持久化缓存层可以避免下层的数据源过载。
3）大尺寸、低价值数据存储:使用传统的关系型数据库存储一些数据时可能会比较昂贵，在此之前，很多时候程序员往往会选择传统的文件进行存储。
4）高伸缩性场景:MongoDB 非常适合由数十或数百台服务器组成的数据库。MongoDB 的路线图中已经包含对MapReduce 引擎的内置支持。
5）对象或JSON 数据存储:MongoDB 的BSON 数据格式非常适合文档化格式的存储及查询。

2）不适用场景如下：