1 MongoDB相关概念
 1.1 业务应用场景
 传统的关系型数据库(如MySQL),在数据操作的“三高”需求以及应对Web2.0的网站需求面前,显得力不从心。
 解释:“三高”需求:
 • High performance - 对数据库高并发读写的需求。
 • Huge Storage - 对海量数据的高效率存储和访问的需求。
 • High Scalability && High Availability- 对数据库的高可扩展性和高可用性的需求。
 而MongoDB可应对“三高”需求。
 具体的应用场景如:
 1)社交场景,使用 MongoDB 存储存储用户信息,以及用户发表的朋友圈信息,通过地理位置索引实现附近的人、地点等功能。
 2)游戏场景,使用 MongoDB 存储游戏用户信息,用户的装备、积分等直接以内嵌文档的形式存储,方便查询、高效率存储和访问。
 3)物流场景,使用 MongoDB 存储订单信息,订单状态在运送过程中会不断更新,以 MongoDB 内嵌数组的形式来存储,一次查询就能将
 订单所有的变更读取出来。
 4)物联网场景,使用 MongoDB 存储所有接入的智能设备信息,以及设备汇报的日志信息,并对这些信息进行多维度的分析。
 5)视频直播,使用 MongoDB 存储用户信息、点赞互动信息等。
 这些应用场景中,数据操作方面的共同特点是:
 (1)数据量大
 (2)写入操作频繁(读写都很频繁)
 (3)价值较低的数据,对事务性要求不高
 对于这样的数据,我们更适合使用MongoDB来实现数据的存储。
 什么时候选择MongoDB
 在架构选型上,除了上述的三个特点外,如果你还犹豫是否要选择它?可以考虑以下的一些问题:
 应用不需要事务及复杂 join 支持
 新应用,需求会变,数据模型无法确定,想快速迭代开发
 应用需要2000-3000以上的读写QPS(更高也可以)
 应用需要TB甚至 PB 级别数据存储
 应用发展迅速,需要能快速水平扩展
 应用要求存储的数据不丢失
 应用需要99.999%高可用
 应用需要大量的地理位置查询、文本查询
 如果上述有1个符合,可以考虑 MongoDB,2个及以上的符合,选择 MongoDB 绝不会后悔。
 思考:如果用MySQL呢?
 答:相对MySQL,可以以更低的成本解决问题(包括学习、开发、运维等成本)
 1.2 MongoDB简介
 SQL术语/概念 MongoDB术语/概念 解释/说明
 database database 数据库
 table collection 数据库表/集合
 row document 数据记录行/文档
 column field 数据字段/域
 index index 索引
 table joins 表连接,MongoDB不支持
 嵌入文档 MongoDB通过嵌入式文档来替代多表连接
 primary key primary key 主键,MongoDB自动将_id字段设置为主键
 MongoDB是一个开源、高性能、无模式的文档型数据库,当初的设计就是用于简化开发和方便扩展,是NoSQL数据库产品中的一种。是最
 像关系型数据库(MySQL)的非关系型数据库。
 它支持的数据结构非常松散,是一种类似于 JSON 的 格式叫BSON,所以它既可以存储比较复杂的数据类型,又相当的灵活。
 MongoDB中的记录是一个文档,它是一个由字段和值对(field:value)组成的数据结构。MongoDB文档类似于JSON对象,即一个文档认
 为就是一个对象。字段的数据类型是字符型,它的值除了使用基本的一些类型外,还可以包括其他文档、普通数组和文档数组。
 1.3 体系结构
 MySQL和MongoDB对比
 1.4 数据模型
 MongoDB的最小存储单位就是文档(document)对象。文档(document)对象对应于关系型数据库的行。数据在MongoDB中以
 BSON(Binary-JSON)文档的格式存储在磁盘上。
 BSON(Binary Serialized Document Format)是一种类json的一种二进制形式的存储格式,简称Binary JSON。BSON和JSON一样,支持
 内嵌的文档对象和数组对象,但是BSON有JSON没有的一些数据类型,如Date和BinData类型。
 BSON采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的三个特点,可
 以有效描述非结构化数据和结构化数据。这种格式的优点是灵活性高,但它的缺点是空间利用率不是很理想。
 Bson中,除了基本的JSON类型:string,integer,boolean,double,null,array和object,mongo还使用了特殊的数据类型。这些类型包括
 date,object id,binary data,regular expression 和code。每一个驱动都以特定语言的方式实现了这些类型,查看你的驱动的文档来获取详
 细信息。
 BSON数据类型参考列表:
 数据类型 描述 举例
 字符串 UTF-8字符串都可表示为字符串类型的数据 {“x” : “foobar”}
 对象id 对象id是文档的12字节的唯一 ID {“X” :ObjectId() }
 布尔值 真或者假:true或者false {“x”:true}+
 数组 值的集合或者列表可以表示成数组 {“x” : [“a”, “b”, “c”]}
 32位整数 类型不可用。JavaScript仅支持64位浮点数,所以32位整数会被
 自动转换。
 shell是不支持该类型的,shell中默认会转换成64
 位浮点数
 64位整数 不支持这个类型。shell会使用一个特殊的内嵌文档来显示64位
 整数
 shell是不支持该类型的,shell中默认会转换成64
 位浮点数
 64位浮点数 shell中的数字就是这一种类型 {“x”:3.14159,“y”:3}
 null 表示空值或者未定义的对象 {“x”:null}
 undefined 文档中也可以使用未定义类型 {“x”:undefined}
 符号 shell不支持,shell会将数据库中的符号类型的数据自动转换成
 字符串
 正则表达式 文档中可以包含正则表达式,采用JavaScript的正则表达式语法 {“x” : /foobar/i}
 代码 文档中还可以包含JavaScript代码 {“x” : function() { /* …… / }}
 二进制数据 二进制数据可以由任意字节的串组成,不过shell中无法使用
 最大值/最
 小值
 BSON包括一个特殊类型,表示可能的最大值。shell中没有这个
 类型。
 提示:
 shell默认使用64位浮点型数值。{“x”:3.14}或{“x”:3}。对于整型值,可以使用NumberInt(4字节符号整数)或NumberLong(8字节符
 号整数),{“x”:NumberInt(“3”)}{“x”:NumberLong(“3”)}
 1.5 MongoDB的特点
 MongoDB主要有如下特点:
 (1)高性能:
 MongoDB提供高性能的数据持久性。特别是,
 对嵌入式数据模型的支持减少了数据库系统上的I/O活动。
 索引支持更快的查询,并且可以包含来自嵌入式文档和数组的键。(文本索引解决搜索的需求、TTL索引解决历史数据自动过期的需求、地
 理位置索引可用于构建各种 O2O 应用)
 mmapv1、wiredtiger、mongorocks(rocksdb)、in-memory 等多引擎支持满足各种场景需求。
 Gridfs解决文件存储的需求。
 (2)高可用性:
 MongoDB的复制工具称为副本集(replica set),它可提供自动故障转移和数据冗余。
 (3)高扩展性:
 MongoDB提供了水平可扩展性作为其核心功能的一部分。
 分片将数据分布在一组集群的机器上。(海量数据存储,服务能力水平扩展)
 从3.4开始,MongoDB支持基于片键创建数据区域。在一个平衡的集群中,MongoDB将一个区域所覆盖的读写只定向到该区域内的那些
 片。
 (4)丰富的查询支持:
 MongoDB支持丰富的查询语言,支持读和写操作(CRUD),比如数据聚合、文本搜索和地理空间查询等。
 (5)其他特点:如无模式(动态模式)、灵活的文档模型、
 2 单机部署
 2.1 Windows系统中的安装启动
 第一步:下载安装包
 MongoDB 提供了可用于 32 位和 64 位系统的预编译二进制包,你可以从MongoDB官网下载安装,MongoDB 预编译二进制包下载地址:
 https://www.mongodb.com/download-center#community 根据上图所示下载 zip 包。
 提示:版本的选择:
 MongoDB的版本命名规范如:x.y.z; y为奇数时表示当前版本为开发版,如:1.5.2、4.1.13; y为偶数时表示当前版本为稳定版,如:1.6.3、4.0.10; z是修正版本号,数字越大越好。
 详情:http://docs.mongodb.org/manual/release-notes/#release-version-numbers
 第二步:解压安装启动
 将压缩包解压到一个目录中。
 在解压目录中,手动建立一个目录用于存放数据文件,如 data/db
 方式1:命令行参数方式启动服务
 在 bin 目录中打开命令行提示符,输入如下命令:
 mongod --dbpath=…\data\db
 我们在启动信息中可以看到,mongoDB的默认端口是27017,如果我们想改变默认的启动端口,可以通过–port来指定端口。
 为了方便我们每次启动,可以将安装目录的bin目录设置到环境变量的path中, bin 目录下是一些常用命令,比如 mongod 启动服务用的,
 mongo 客户端连接服务用的。
 方式2:配置文件方式启动服务
 在解压目录中新建 config 文件夹,该文件夹中新建配置文件 mongod.conf ,内如参考如下:
 storage: #The directory where the mongod instance stores its data.Default Value is “\data\db” on Windows. dbPath: D:\02_Server\DBServer\mongodb-win32-x86_64-2008plus-ssl-4.0.1\data
 详细配置项内容可以参考官方文档:https://docs.mongodb.com/manual/reference/configuration-options/
 【注意】
 1)配置文件中如果使用双引号,比如路径地址,自动会将双引号的内容转义。如果不转义,则会报错:
 error-parsing-yaml-config-file-yaml-cpp-error-at-line-3-column-15-unknown-escape-character-d
 解决:
 a. 对 \ 换成 / 或 \
 b. 如果路径中没有空格,则无需加引号。
 2)配置文件中不能以Tab分割字段
 解决:
 将其转换成空格。
 启动方式:
 更多参数配置:
 2.2 Shell连接(mongo命令)
 在命令提示符输入以下shell命令即可完成登陆
 查看已经有的数据库
 退出mongodb
 更多参数可以通过帮助查看:
 提示:
 MongoDB javascript shell是一个基于javascript的解释器,故是支持js程序的。
 2.3 Compass-图形化界面客户端
 到MongoDB官网下载MongoDB Compass,
 地址:https://www.mongodb.com/download-center/v2/compass?initial=true
 如果是下载安装版,则按照步骤安装;如果是下载加压缩版,直接解压,执行里面的 MongoDBCompassCommunity.exe 文件即可。
 在打开的界面中,输入主机地址、端口等相关信息,点击连接:
 mongod -f …/config/mongod.conf 或mongod --config …/config/mongod.conf systemLog: destination: file #The path of the log file to which mongod or mongos should send all diagnostic logging information path: “D:/02_Server/DBServer/mongodb-win32-x86_64-2008plus-ssl-4.0.1/log/mongod.log” logAppend: true storage: journal: enabled: true #The directory where the mongod instance stores its data.Default Value is “/data/db”. dbPath: “D:/02_Server/DBServer/mongodb-win32-x86_64-2008plus-ssl-4.0.1/data” net:#bindIp: 127.0.0.1 port: 27017 setParameter: enableLocalhostAuthBypass: false mongo 或mongo --host=127.0.0.1 --port=27017 >show databases exit mongo --help
 2.4 Linux系统中的安装启动和连接
 目标:在Linux中部署一个单机的MongoDB,作为生产环境下使用。
 提示:和Windows下操作差不多。
 步骤如下:
 (1)先到官网下载压缩包 mongod-linux-x86_64-4.0.10.tgz 。 (2)上传压缩包到Linux中,解压到当前目录:
 (3)移动解压后的文件夹到指定的目录中:
 (4)新建几个目录,分别用来存储数据和日志:
 (5)新建并修改配置文件
 配置文件的内容如下:
 tar -xvf mongodb-linux-x86_64-4.0.10.tgz mv mongodb-linux-x86_64-4.0.10 /usr/local/mongodb #数据存储目录 mkdir -p /mongodb/single/data/db #日志存储目录 mkdir -p /mongodb/single/log vi /mongodb/single/mongod.conf systemLog: #MongoDB发送所有日志输出的目标指定为文件 # #The path of the log file to which mongod or mongos should send all diagnostic logging information destination: file #mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径 path: “/mongodb/single/log/mongod.log” #当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。 logAppend: true storage: #mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。 ##The directory where the mongod instance stores its data.Default Value is “/data/db”. dbPath: “/mongodb/single/data/db” journal: #启用或禁用持久性日志以确保数据文件保持有效和可恢复。 enabled: true processManagement: #启用在后台运行mongos或mongod进程的守护进程模式。 fork: true net:#服务实例绑定的IP,默认是localhost bindIp: localhost,192.168.0.2
 (6)启动MongoDB服务
 注意:
 如果启动后不是 successfully ,则是启动失败了。原因基本上就是配置文件有问题。
 通过进程来查看服务是否启动了:
 (7)分别使用mongo命令和compass工具来连接测试。
 提示:如果远程连接不上,需要配置防火墙放行,或直接关闭linux防火墙
 (8)停止关闭服务
 停止服务的方式有两种:快速关闭和标准关闭,下面依次说明:
 (一)快速关闭方法(快速,简单,数据可能会出错)
 目标:通过系统的kill命令直接杀死进程:
 杀完要检查一下,避免有的没有杀掉。
 【补充】
 如果一旦是因为数据损坏,则需要进行如下操作(了解):
 1)删除lock文件:
 2)修复数据:
 (二)标准的关闭方法(数据不容易出错,但麻烦):
 目标:通过mongo客户端中的shutdownServer命令来关闭服务
 主要的操作步骤参考如下:
 3 基本常用命令
 #bindIp #绑定的端口,默认是27017 port: 27017 [root@bobohost single]# /usr/local/mongodb/bin/mongod -f /mongodb/single/mongod.conf about to fork child process, waiting until server is ready for connections. forked process: 90384 child process started successfully, parent exiting [root@bobohost single]# ps -ef |grep mongod root 90384 1 0 8月26 ? 00:02:13 /usr/local/mongdb/bin/mongod -f /mongodb/single/mongod.conf #查看防火墙状态 systemctl status firewalld #临时关闭防火墙 systemctl stop firewalld #开机禁止启动防火墙 systemctl disable firewalld #通过进程编号关闭节点 kill -2 54410 rm -f /mongodb/single/data/db/.lock /usr/local/mongdb/bin/mongod --repair --dbpath=/mongodb/single/data/db //客户端登录服务,注意,这里通过localhost登录,如果需要远程登录,必须先登录认证才行。 mongo --port 27017 //#切换到admin库 use admin //关闭服务 db.shutdownServer()
 专栏文章评论 comment
 字段名称 字段含义 字段类型 备注
 _id ID ObjectId或String Mongo的主键的字段
 articleid 文章ID String
 content 评论内容 String
 userid 评论人ID String
 nickname 评论人昵称 String
 createdatetime 评论的日期时间 Date
 likenum 点赞数 Int32
 replynum 回复数 Int32
 state 状态 String 0:不可见;1:可见;
 parentid 上级ID String 如果为0表示文章的顶级评论
 3.1 案例需求
 存放文章评论的数据存放到MongoDB中,数据结构参考如下:
 数据库:articledb
 3.2 数据库操作
 3.2.1 选择和创建数据库
 选择和创建数据库的语法格式:
 如果数据库不存在则自动创建,例如,以下语句创建 spitdb 数据库:
 查看有权限查看的所有的数据库命令
 注意: 在 MongoDB 中,集合只有在内容插入后才会创建! 就是说,创建集合(数据表)后要再插入一个文档(记录),集合才会真正创建。
 查看当前正在使用的数据库命令
 MongoDB 中默认的数据库为 test,如果你没有选择数据库,集合将存放在 test 数据库中。
 另外:
 数据库名可以是满足以下条件的任意UTF-8字符串。
 不能是空字符串("")。
 不得含有’ '(空格)、.、KaTeX parse error: Undefined control sequence: \和 at position 4: 、/、\̲和̲\0 (空字符)。 应全部小写…。
 3.3.2 集合的隐式创建
 当向一个集合中插入一个文档的时候,如果集合不存在,则会自动创建集合。
 详见 文档的插入 章节。
 提示:通常我们使用隐式创建文档即可。
 3.3.3 集合的删除
 集合删除语法格式如下:
 返回值
 如果成功删除选定集合,则 drop() 方法返回 true,否则返回 false。
 例如:要删除mycollection集合
 3.4 文档基本CRUD
 文档(document)的数据结构和 JSON 基本一样。
 所有存储在集合中的数据都是 BSON 格式。
 3.4.1 文档的插入
 (1)单个文档插入
 使用insert() 或 save() 方法向集合中插入文档,语法如下:
 db.createCollection(name) db.createCollection(“mycollection”) show collections 或show tables db.collection.drop() 或db.集合.drop() db.mycollection.drop()
 Parameter Type Description
 document
 document
 or array
 要插入到集合中的文档或文档数组。((json格式)
 writeConcern document
 Optional. A document expressing the write concern. Omit to use the default write concern.
 See Write Concern.Do not explicitly set the write concern for the operation if run in a
 transaction. To use write concern with transactions, see Transactions and Write Concern. ordered boolean
 可选。如果为真,则按顺序插入数组中的文档,如果其中一个文档出现错误,MongoDB将返回而
 不处理数组中的其余文档。如果为假,则执行无序插入,如果其中一个文档出现错误,则继续处理
 数组中的主文档。在版本2.6+中默认为true
 参数:
 【示例】
 要向comment的集合(表)中插入一条测试数据:
 提示:
 1)comment集合如果不存在,则会隐式创建
 2)mongo中的数字,默认情况下是double类型,如果要存整型,必须使用函数NumberInt(整型数字),否则取出来就有问题了。
 3)插入当前日期使用 new Date() 4)插入的数据没有指定 _id ,会自动生成主键值
 5)如果某字段没值,可以赋值为null,或不写该字段。
 执行后,如下,说明插入一个数据成功了。
 注意:1. 文档中的键/值对是有序的。
2. 文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。 3. MongoDB区分类型和大小写。
3. MongoDB的文档不能有重复的键。
4. 文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
 文档键命名规范:
 键不能含有\0 (空字符)。这个字符用来表示键的结尾。
 .和set来实现,命令如下:
 我们想修改_id为2的记录,浏览量为889,输入以下语句:
 这样就OK啦。
 (3)批量的修改
 更新所有用户为 1003 的用户的昵称为 凯撒大帝 。
 提示:如果不加后面的参数,则只更新符合条件的第一条记录
 (3)列值增长的修改
 如果我们想实现对某列值在原有值的基础上进行增加或减少,可以使用 KaTeX parse error: Expected '}', got 'EOF' at end of input: …ate({_id:"2"},{set:{likenum:NumberInt(889)}}) //默认只修改第一条数据 db.comment.update({userid:“1003”},{KaTeX parse error: Expected 'EOF', got '}' at position 21: …nickname:"凯撒2"}}̲) //修改所有符合条件的数据…set:{nickname:“凯撒大帝”}},{multi:true}) db.comment.update({_id:“3”},{KaTeX parse error: Expected 'EOF', got '}' at position 27: …m:NumberInt(1)}}̲) db.集合名称.remov…in操作符。 示例:查询评论的集合中userid字段包含1003或1004的文档
 不包含使用and操作符将条件进行关联。(相 当于SQL的and) 格式为:
 示例:查询评论集合中likenum大于等于700 并且小于2000的文档:
 如果两个以上条件之间是或者的关系,我们使用 操作符进行关联,与前面 and的使用方式相同 格式为:
 示例:查询评论集合中userid为1003,或者点赞数小于1000的文档记录
 db.comment.find().sort({userid:-1,likenum:1}) db.collection.find({field:/正则表达式/}) 或db.集合.find({字段:/正则表达式/}) db.comment.find({content:/开水/}) db.comment.find({content:/^专家/}) db.集合名称.find({ “field” : { $gt: value }}) // 大于: field > value db.集合名称.find({ “field” : { $lt: value }}) // 小于: field < value db.集合名称.find({ “field” : { $gte: value }}) // 大于等于: field >= value db.集合名称.find({ “field” : { $lte: value }}) // 小于等于: field <= value db.集合名称.find({ “field” : { KaTeX parse error: Expected 'EOF', got '}' at position 11: ne: value }̲}) // 不等于: fiel…gt:NumberInt(700)}}) db.comment.find({userid:{KaTeX parse error: Expected 'EOF', got '}' at position 19: …["1003","1004"]}̲}) db.comment.f…nin:[“1003”,“1004”]}}) KaTeX parse error: Expected '}', got 'EOF' at end of input: ….comment.find({and:[{likenum:{KaTeX parse error: Expected 'EOF', got '}' at position 19: …:NumberInt(700)}̲},{likenum:{lt:NumberInt(2000)}}]}) KaTeX parse error: Expected '}', got 'EOF' at end of input: ….comment.find({or:[ {userid:“1003”} ,{likenum:{$lt:1000} }]})
 3.7 常用命令小结选择切换数据库:use articledb
 插入数据:db.comment.insert({bson数据})
 查询所有数据:db.comment.find();
 条件查询数据:db.comment.find({条件})
 查询符合条件的第一条记录:db.comment.findOne({条件})
 查询符合条件的前几条记录:db.comment.find({条件}).limit(条数)
 查询符合条件的跳过的记录:db.comment.find({条件}).skip(条数)
 修改数据:db.comment.update({条件},{修改后的数据})
 或db.comment.update({条件},{KaTeX parse error: Expected '}', got 'EOF' at end of input: …t.update({条件},{inc:{自增的字段:步进值}})
 删除数据:db.comment.remove({条件})
 统计查询:db.comment.count({条件})
 模糊查询:db.comment.find({字段名:/正则表达式/})
 条件比较运算:db.comment.find({字段名:{KaTeX parse error: Expected 'EOF', got '}' at position 5: gt:值}̲}) 包含查询:db.co…in:[值1,值2]}})或db.comment.find({字段名:{KaTeX parse error: Expected 'EOF', got '}' at position 12: nin:[值1,值2]}̲}) 条件连接查询:db.…and:[{条件1},{条件2}]})或db.comment.find({$or:[{条件1},{条件2}]})