文章目录

  • 一、Nosql概述
  • 为什么使用Nosql
  • 1、单机Mysql时代
  • 2、Memcached(缓存) + Mysql + 垂直拆分(读写分离)
  • 3、分库分表 + 水平拆分 + Mysql集群
  • 4、如今最近的年代
  • 什么是Nosql
  • 1.NoSQL = Not Only SQL(不仅仅是SQL)
  • 2.Nosql特点
  • 3.Nosql的四大分类
  • KV键值对
  • 文档型数据库(bson数据格式):
  • 列存储数据库
  • 图关系数据库


一、Nosql概述

为什么使用Nosql

1、单机Mysql时代

Redis最初是由哪家公司开发的 redis发展史_数据库


90年代,一个网站的访问量一般不会太大,单个数据库完全够用。随着用户增多,网站出现以下问题

1.数据量增加到一定程度,单机数据库就放不下了

2.数据的索引(B+ Tree),一个机器内存也存放不下

3.访问量变大后(读写混合),一台服务器承受不住

2、Memcached(缓存) + Mysql + 垂直拆分(读写分离)

网站80%的情况都是在读,每次都要去查询数据库的话就十分的麻烦!所以说我们希望减轻数据库的压力,我们可以使用缓存来保证效率!

Redis最初是由哪家公司开发的 redis发展史_nosql_02


优化过程经历了以下几个过程:

1.优化数据库的数据结构和索引(难度大)

2.文件缓存,通过IO流获取比每次都访问数据库效率略高,但是流量爆炸式增长时候,IO流也承受不了

3.MemCache,当时最热门的技术,通过在数据库和数据库访问层之间加上一层缓存,第一次访问时查询数据库,将结果保存到缓存,后续的查询先检查缓存,若有直接拿去使用,效率显著提升。

3、分库分表 + 水平拆分 + Mysql集群

Redis最初是由哪家公司开发的 redis发展史_redis_03

4、如今最近的年代

如今信息量井喷式增长,各种各样的数据出现(用户定位数据,图片数据等),大数据的背景下关系型数据库(RDBMS)无法满足大量数据要求。Nosql数据库就能轻松解决这些问题。

目前一个基本的互联网项目

Redis最初是由哪家公司开发的 redis发展史_数据库_04


为什么要用NoSQL ?

用户的个人信息,社交网络,地理位置。用户自己产生的数据,用户日志等等爆发式增长!

这时候我们就需要使用NoSQL数据库的,Nosql可以很好的处理以上的情况!

什么是Nosql

1.NoSQL = Not Only SQL(不仅仅是SQL)

Not Only Structured Query Language

关系型数据库:列+行,同一个表下数据的结构是一样的。

非关系型数据库:数据存储没有固定的格式,并且可以进行横向扩展。

NoSQL泛指非关系型数据库,随着web2.0互联网的诞生,传统的关系型数据库很难对付web2.0时代!尤其是超大规模的高并发的社区,暴露出来很多难以克服的问题,NoSQL在当今大数据环境下发展的十分迅速,Redis是发展最快的。

2.Nosql特点

1.方便扩展(数据之间没有关系,很好扩展!)

2.大数据量高性能(Redis一秒可以写8万次,读11万次,NoSQL的缓存记录级,是一种细粒度的缓存,性能会比较高!)

3.数据类型是多样型的!(不需要事先设计数据库,随取随用)

4.传统的 RDBMS 和 NoSQL

传统的 RDBMS(关系型数据库)
- 结构化组织
- SQL
- 数据和关系都存在单独的表中 row col
- 操作,数据定义语言
- 严格的一致性
- 基础的事务
- ...


Nosql
- 不仅仅是数据
- 没有固定的查询语言
- 键值对存储,列存储,文档存储,图形数据库(社交关系)
- 最终一致性
- CAP定理和BASE
- 高性能,高可用,高扩展
- .....

大数据时代的3V :主要是描述问题的

1.海量Velume

2.多样Variety

3.实时Velocity

大数据时代的3高 : 主要是对程序的要求

1.高并发

2.高可扩

3.高性能

真正在公司中的实践:NoSQL + RDBMS 一起使用才是最强的。

3.Nosql的四大分类

KV键值对

分类: Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB
Examples举例: 内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等。
典型应用场景: Key 指向 Value 的键值对,通常用hash table来实现
优点: 查找速度快
缺点: 数据无结构化,通常只被当作字符串或者二进制数据

文档型数据库(bson数据格式):
  • MongoDB(掌握)

基于分布式文件存储的数据库。C++编写,用于处理大量文档。
MongoDB是RDBMS和NoSQL的中间产品。MongoDB是非关系型数据库中功能最丰富的,NoSQL中最像关系型数据库的数据库。

  • ConthDB

分类: CouchDB, MongoDb
Examples举例: Web应用(与Key-Value类似,Value是结构化的,不同的是数据库能够了解Value的内容)
典型应用场景: Key-Value对应的键值对,Value为结构化数据
优点: 数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构
缺点: 查询性能不高,而且缺乏统一的查询语法。

列存储数据库
  • HBase(大数据必学)
  • 分布式文件系统

分类: Cassandra, HBase, Riak
Examples举例: 分布式的文件系统
典型应用场景: 以列簇式存储,将同一列数据存在一起
优点: 查找速度快,可扩展性强,更容易进行分布式扩展
缺点: 功能相对局限

图关系数据库
  • Neo4j、InfoGrid

分类: Neo4J, InfoGrid, Infinite Graph
Examples举例: 社交网络,推荐系统等。专注于构建关系图谱
典型应用场景: 图结构
优点: 利用图结构相关算法。比如最短路径寻址,N度关系查找等
缺点: 很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群