mongdb 数据分析 mongdb教程

转载

mob64ca140eb362 2024-08-27 22:45:02

文章标签 mongdb 数据分析 mongodb 数据库字段数据 文章分类 数据分析人工智能

文章目录

1 案例需求
2 数据库操作
3 集合操作
4 文档基本 CRUD

4.1 文档插入

4.1.1 单个文档插入
4.1.2 批量插入

4.2 文档基本查询
4.3 文档更新
4.4 文档删除

5 文档分页查询

5.1 统计查询
5.2 分页列表查询
5.3 排序查询

6 文档更多查询

6.1 模糊查询
6.2 比较查询
6.3 包含查询
6.4 条件连接查询

7 常用命令小结
8 索引-Index

8.1 概述
8.2 索引类型

8.2.1 单字段索引
8.2.2 复合索引
8.2.3 其他索引

8.3 索引的管理操作

8.3.1 索引查看
8.3.2 索引创建
8.3.3 索引移除

8.4 索引的使用

8.4.1 执行计划
8.4.2 涵盖的查询

1 案例需求

存放文章评论的数据存放到MongoDB中，数据结构参考如下：
数据库：articledb

专栏文章评论	comment
字段名称	字段含义	字段类型	备注
_id	ID	ObjectId或String	Mongo的主键的字段
articleid	文章ID	String
content	评论内容	String
userid	评论人ID	String
nickname	评论人昵称	String
createdatetime	评论的日期时间	Date
likenum	点赞数	Int32
replynum	回复数	Int32
state	状态	String	0：不可见；1：可见；
parentid	上级ID	String	如果为0表示文章的顶级评论

2 数据库操作

# 选择和创建数据库 
# use 数据库名称，如果数据库不存在则自动创建
> use articledb
switched to db articledb
# 查看有权限查看的所有的数据库命令
# 只有在 articledb 中插入第一个集合后才会持久化
> show dbs
admin   0.000GB
config  0.000GB
local   0.000GB
# 查看当前正在使用的数据库
> db
articledb
# 主要删除已经持久化的数据库
> db.dropDatabase()
{ "ok" : 1 }

在 MongoDB 中，数据库只有在插入第一条文档后才会持久化数据，否则只是内存中。

MongoDB 中默认的数据库为 test，如果你没有选择数据库，集合将存放在 test 数据库中。

数据库名可以是满足以下条件的任意 UTF-8 字符串。

不能是空字符串（"")。
不得含有’ '（空格)、.、$、/、\和\0 (空字符)。
应全部小写。
最多64字节。

有一些数据库名是保留的，可以直接访问这些有特殊作用的数据库。

admin：从权限的角度来看，这是"root"数据库。要是将一个用户添加到这个数据库，这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行，比如列出所有的数据库或者关闭服务器。
local: 这个数据永远不会被复制，可以用来存储限于本地单台服务器的任意集合。
config: 当Mongo用于分片设置时，config数据库在内部使用，用于保存分片的相关信息。

3 集合操作

集合，类似关系型数据库中的表。可以显示的创建，也可以隐式的创建。

# 显式创建 
# db.createCollection(name), name: 要创建的集合名称
> db.createCollection('my')
# 查看当前库中的表
# show tables 或 show collections
> show collections
my
# 集合删除
# db.集合.drop(), 如果成功删除选定集合，则 drop() 方法返回 true，否则返回 false
> db.my.drop()
true

集合的隐式创建：当向一个集合中插入一个文档的时候，如果集合不存在，则会自动创建集合。

集合的命名规范：

集合名不能是空字符串""。
集合名不能含有\0字符（空字符)，这个字符表示集合名的结尾。
集合名不能以"system."开头，这是为系统集合保留的前缀。
用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含，这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合，否则千万不要在名字里出现 $。

4 文档基本 CRUD

文档（document）的数据结构和 JSON 基本一样。所有存储在集合中的数据都是 BSON 格式。

所有命令见官网 https://docs.mongodb.com/manual/crud/

中文网 https://www.mongodb.org.cn/tutorial

4.1 文档插入

4.1.1 单个文档插入

使用insert() 或 save() 方法向集合中插入文档，语法如下：

db.collection.insert( 
	<document or array of documents>, 
	{ 
		writeConcern: <document>,
		ordered: 	<boolean> 
	} 
)

参数说明：

参数	类型	说明
document	document or array	要插入到集合中的文档或文档数组。（(json格式）
writeConcern	document	MongoDB写入安全机制，是一种客户端设置，用于控制写入安全的级别。
ordered	boolean	可选。如果为真，则按顺序插入数组中的文档，如果其中一个文档出现错误，MongoDB将返回而不处理数组中的其余文档。如果为假，则执行无序插入，如果其中一个文档出现错误，则继续处理数组中的主文档。在版本2.6+中默认为true

实例：

# 要向comment的集合(表)中插入一条测试数据
> db.comment.insert(
	{
		"articleid":"100000",
		"content":"今天天气真好，阳光明 媚",
		"userid":"1001",
		"nickname":"Rose",
		"createdatetime":new Date(),
		"likenum":NumberInt(10),
		"state":null
	}
)
# 表示插入一条数据成功
WriteResult({ "nInserted" : 1 })

说明：

comment 集合如果不存在，则会隐式创建。
mongo 中的数字，默认情况下是 double 类型，如果要存整型，必须使用函数 NumberInt(整型数字)，否则取出来就有问题了。
插入当前日期使用 new Date()。
插入的数据没有指定 _id ，会自动生成主键值。
如果某字段没值，可以赋值为 null，或不写该字段。

注意：

文档中的键/值对是有序的。
文档中的值不仅可以是在双引号里面的字符串，还可以是其他几种数据类型（甚至可以是整个嵌入的文档)。
MongoDB区分类型和大小写。
MongoDB的文档不能有重复的键。
文档的键是字符串。除了少数例外情况，键可以使用任意UTF-8字符。

文档键命名规范：

键不能含有 “\0” (空字符)。这个字符用来表示键的结尾。
“.” 和 “$” 有特别的意义，只有在特定环境下才能使用。
以下划线 “_” 开头的键是保留的(不是严格要求的)。

4.1.2 批量插入

语法

db.collection.insertMany( 
	[<document 1>, <document 2>, ...], 
	{ 
		writeConcern: <document>,
		ordered: 	<boolean> 
	} 
)

实例：

> db.comment.insertMany([
	{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" },
	{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" },
	{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" },
	{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" },
	{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }
])

# 批量插入成功
{
	"acknowledged" : true,
	"insertedIds" : [
		"1",
		"2",
		"3",
		"4",
		"5"
	]
}

说明：

插入时指定了 _id ，则主键就是该值。
如果某条数据插入失败，将会终止插入，但已经插入成功的数据不会回滚掉。
因为批量插入由于数据较多容易出现失败，因此，可以使用try catch进行异常捕捉处理。

> try {
db.comment.insertMany([
	{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }
	{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }
	{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
	{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
	{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }
]);
} catch(e){
	print(e);
}

4.2 文档基本查询

查询数据的语法格式如下：

db.collection.find(<query>, [projection])

参数说明：

参数	类型	说明
query	document	可选。使用查询运算符指定选择筛选器。若要返回集合中的所有文档，省略此参数或传递空文档 ({})。
projection	document	可选。指定要在与查询筛选器匹配的文档中返回的字段（投影）。若要返回匹配文档中的所有字段，请省略此参数。

实例：

# 查询所有 db.comment.find() 或 db.comment.find({})
> db.comment.find({})
{ "_id" : ObjectId("60f426cc99c55de210b477a8"), "articleid" : "100000", "content" : "今天天气真好，阳光明 媚", "userid" : "1001", "nickname" : "Rose", "createdatetime" : ISODate("2021-07-18T13:04:12.085Z"), "likenum" : 10, "state" : null }
{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }
{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }

# 查询 userid 为 1003 的记录
> db.comment.find({userid:'1003'})
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }

# 只返回符合条件的第一条数据
> db.comment.findOne({userid:'1003'})
{
	"_id" : "4",
	"articleid" : "100001",
	"content" : "专家说不能空腹吃饭，影响健康。",
	"userid" : "1003",
	"nickname" : "凯 撒",
	"createdatetime" : ISODate("2019-08-06T08:18:35.288Z"),
	"likenum" : 2000,
	"state" : "1"
}

# 投影查询，查询结果返回部分字段，则需要使用投影查询（不显示所有字段，只显示指定的字段）
# 查询结果只显示 _id、userid、nickname，默认显示 _id
> db.comment.find({userid:'1003'},{userid:1, nickname:1})
{ "_id" : "4", "userid" : "1003", "nickname" : "凯 撒" }
{ "_id" : "5", "userid" : "1003", "nickname" : "凯撒" }

# 查询结果只显示 、userid、nickname ，不显示 _id
> db.comment.find({userid:'1003'},{userid:1, nickname:1,_id:0})
{ "userid" : "1003", "nickname" : "凯 撒" }
{ "userid" : "1003", "nickname" : "凯撒" }

4.3 文档更新

更新文档的语法：

db.collection.update(query, update, options) 
# 或 
db.collection.update( 
	<query>, 
	<update>,
	{ 
		upsert: <boolean>, 
		multi: <boolean>, 
		writeConcern: <document>, 
		collation: <document>, 
		arrayFilters: [ <filterdocument1>, ... ], 
		hint: <document|string> # Available starting in MongoDB 4.2 
	} 
)

参数说明：

参数	类型	说明
query	document	更新的选择条件。可以使用与 find() 方法中相同的查询选择器，类似 sql update 查询内 where 后面的。在3.0版中进行了更改：当使用 upsert:true 执行 update() 时，如果查询使用点表示法在 _id 字段上指定条件，则 MongoDB 将拒绝插入新文档。
update	document or pipeline	要应用的修改。该值可以是：包含更新运算符表达式的文档，或仅包含：对的替换文档，或在MongoDB 4.2中启动聚合管道。
upsert	boolean	可选。如果设置为true，则在没有与查询条件匹配的文档时创建新文档。默认值为false，如果找不到匹配项，则不会插入新文档。
multi	boolean	可选。如果设置为true，则更新符合查询条件的多个文档。如果设置为false，则更新一个文档。默认值为false。
writeConcern	document	可选。表示写问题的文档。抛出异常的级别。
collation	document	可选。指定要用于操作的校对规则。校对规则允许用户为字符串比较指定特定于语言的规则，例如字母大小写和重音标记的规则。
arrayFilters	array	可选。一个筛选文档数组，用于确定要为数组字段上的更新操作修改哪些数组元素。3.6版+
hint	Document or string	可选。指定用于支持查询谓词的索引的文档或字符串。该选项可以采用索引规范文档或索引名称字符串。如果指定的索引不存在，则说明操作错误。例如，请参阅版本4中的“为更新操作指定提示。

实例：

# 1. 覆盖修改 
# 修改_id为1的记录，点赞量为1001
> db.comment.update({_id:"2"},{likenum:NumberInt(1001)})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
# 可以看到这条文档除了likenum字段其它字段都不见了
> db.comment.find({_id:'2'})
{ "_id" : "2", "likenum" : 1001 }

# 2. 局部修改
# 要使用修改器$set来实现
# 改 _id 为 4 的记录，浏览量为 889
> db.comment.update({_id:'4'},{$set:{likenum:NumberInt(889)}})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })

# 修改结果
> db.comment.find({_id:"4"})
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 889, "state" : "1" }

# 3. 批量修改，更新所有用户为 1003 的用户的昵称为 凯撒大帝
# 默认只修改第一条数据
> db.comment.update({userid:'1003'},{$set:{nickname:'凯撒大帝'}});

# 修改所有符合条件的数据，需要加上设置 {multi:true}
> db.comment.update({userid:'1003'},{$set:{nickname:'凯撒大帝'}},{multi:true});
WriteResult({ "nMatched" : 2, "nUpserted" : 0, "nModified" : 2 })

# 4. 列值增长的修改
# 现对某列值在原有值的基础上进行增加或减少，可以使用 $inc 运算符来实现。
# 对 3 号数据的点赞数，每次递增 1
> db.comment.find({_id:'3'},{likenum:1})
{ "_id" : "3", "likenum" : 666 }

# 自增 1
> db.comment.update({_id:'3'},{$inc:{likenum:NumberInt(1)}})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
> db.comment.find({_id:'3'},{likenum:1})
{ "_id" : "3", "likenum" : 667 }

4.4 文档删除

删除文档的语法结构：

db.集合名称.remove(名称)

# 删除所有
db.集合名称.remove({})

# 删除 _id 为 1 的记录
> db.comment.remove({_id:1})
> db.comment.remove({_id:"1"})
WriteResult({ "nRemoved" : 1 })

5 文档分页查询

5.1 统计查询

语法结构

db.collection.count(query, options)

参数说明：

参数	类型	说明
query	document	查询选择条件
options	document	可选。用于修改计数的额外选项

# 统计所有记录
> db.comment.find()

# 按条件统计记录数
> db.comment.count({userid:"1003"})
2

5.2 分页列表查询

可以使用limit()方法来读取指定数量的数据，使用skip()方法来跳过指定数量的数据。

语法结构

db.collection.find().limit(length).skip(offset)

# 返回指定条数的记录，可以在find方法后调用 limit 来返回结果(TopN)，默认值 20。
db.comment.find.limit(3)

# skip方法同样接受一个数字参数作为跳过的记录条数。默认值是 0。
db.comment.find.skip(3)

分页查询

# 第一页
> db.comment.find().skip(0).limit(2)
{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }

# 第二页
> db.comment.find().skip(2).limit(2)
{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }

# 第三页
> db.comment.find().skip(4).limit(2)
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }

5.3 排序查询

sort() 方法对数据进行排序，sort() 方法可以通过参数指定排序的字段。1 为升序排列，-1 是用于降序排列。

语法结构

db.collection.find().sort({key:1(-1)})

# 对 userid 降序排列，并对访问量进行升序排列
> db.comment.find().sort({userid:-1,likenum:1})
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }
{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }
{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }

6 文档更多查询

6.1 模糊查询

通过正则表达式（js 语法）实现

db.collection.find({field:/正则表达式/})

# 要查询评论内容包含"开水"的所有文档
> db.comment.find({content:/开水/})
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }
{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
# 查询评论的内容中以“专家”开头的
> db.comment.find({content:/^专家/})
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }

6.2 比较查询

<, <=, >, >= 这个操作符

# 大于: field > value
db.collection.find({ "field" : { $gt: value }})
# 小于: field < value 
db.collection.find({ "field" : { $lt: value }})
# 大于等于: field >= value 
db.collection.find({ "field" : { $gte: value }})
# // 小于等于: field <= value 
db.collection.find({ "field" : { $lte: value }})
# 不等于: field != value
db.collection.find({ "field" : { $ne: value }})

# 查询评论点赞数量大于700的记录
> db.comment.find({likenum:{$gt:NumberInt(700)}})
{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }

6.3 包含查询

语法结构

# 包含
db.comment.find({userid:{$in:[...]}})

# 不包含
db.comment.find({userid:{$nin:[...]}})

# 查询评论的集合中userid字段包含1003或1004的文档
> db.comment.find({userid:{$in:["1003","1004"]}})
{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" } 

# 查询评论集合中userid字段不包含1003和1004的文档
> db.comment.find({userid:{$nin:["1003","1004"]}})
{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }

6.4 条件连接查询

查询同时满足两个以上条件，需要使用$and操作符将条件进行关联

$and:[{},{},{}]

# 查询评论集合中 likenum 大于等于 700 并且小于 2000 的文档
> db.comment.find({$and:[{likenum:{$gte:NumberInt(700)}},{likenum:{$lt:NumberInt(2000)}}]})
{ "_id" : "1", "articleid" : "100001", "content" : "我们不应该把清晨浪费在手机上，健康很重要，一杯温水幸福你我 他。", "userid" : "1002", "nickname" : "相忘于江湖", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 1000, "state" : "1" }
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }

查询或者的关系，我们使用 $or 操作符进行关联

$or:[{},{},{}]

# 查询评论集合中userid为1003，或者点赞数小于1000的文档记录
> db.comment.find({$or:[{userid:"1003"},{likenum:{$lt:1000}}]})
{ "_id" : "2", "articleid" : "100001", "content" : "我夏天空腹喝凉开水，冬天喝温开水", "userid" : "1005", "nickname" : "伊人憔 悴", "createdatetime" : ISODate("2019-08-05T23:58:51.485Z"), "likenum" : 888, "state" : "1" }
{ "_id" : "3", "articleid" : "100001", "content" : "我一直喝凉开水，冬天夏天都喝。", "userid" : "1004", "nickname" : "杰克船 长", "createdatetime" : ISODate("2019-08-06T01:05:06.321Z"), "likenum" : 666, "state" : "1" }
{ "_id" : "4", "articleid" : "100001", "content" : "专家说不能空腹吃饭，影响健康。", "userid" : "1003", "nickname" : "凯 撒", "createdatetime" : ISODate("2019-08-06T08:18:35.288Z"), "likenum" : 2000, "state" : "1" }
{ "_id" : "5", "articleid" : "100001", "content" : "研究表明，刚烧开的水千万不能喝，因为烫 嘴。", "userid" : "1003", "nickname" : "凯撒", "createdatetime" : ISODate("1970-01-01T00:00:00Z"), "likenum" : 3000, "state" : "1" }

7 常用命令小结

选择切换数据库：use articledb 
插入数据：db.comment.insert({bson数据}) 
查询所有数据：db.comment.find()
条件查询数据：db.comment.find({条件}) 
查询符合条件的第一条记录：db.comment.findOne({条件}) 
查询符合条件的前几条记录：db.comment.find({条件}).limit(条数) 
查询符合条件的跳过的记录：db.comment.find({条件}).skip(条数) 
修改数据：db.comment.update({条件},{修改后的数据}) 或 db.comment.update({条件},{$set:{要修改部分的字段:数据}) 
修改数据并自增某字段值：db.comment.update({条件},{$inc:{自增的字段:步进值}}) 
删除数据：db.comment.remove({条件}) 
统计查询：db.comment.count({条件}) 
模糊查询：db.comment.find({字段名:/正则表达式/}) 
条件比较运算：db.comment.find({字段名:{$gt:值}}) 
包含查询：db.comment.find({字段名:{$in:[值1，值2]}})或db.comment.find({字段名:{$nin:[值1，值2]}}) 
条件连接查询：db.comment.find({$and:[{条件1},{条件2}]})或db.comment.find({$or:[{条件1},{条件2}]})

8 索引-Index

8.1 概述

索引支持在 MongoDB 中高效地执行查询。如果没有索引，MongoDB必须执行全集合扫描，即扫描集合中的每个文档，以选择与查询语句匹配的文档。

如果查询存在适当的索引，MongoDB可以使用该索引限制必须检查的文档数。

索引是特殊的数据结构，它以易于遍历的形式存储集合数据集的一小部分。索引存储特定字段或一组字段的值，按字段值排序。索引项的排序支持有效的相等匹配和基于范围的查询操作。此外，MongoDB还可以使用索引中的排序返回排序结果。
官网文档：https://docs.mongodb.com/manual/indexes

MongoDB 索引使用 B-Tree 树数据结构（MySQL是 B+Tree）。

8.2 索引类型

8.2.1 单字段索引

MongoDB 支持在文档的单个字段上创建用户定义的升序/降序索引，称为单字段索引（Single Field Index）。

对于单个字段索引和排序操作，索引键的排序顺序（即升序或降序）并不重要，因为 MongoDB 可以在任何方向上遍历索引。

mongdb 数据分析 mongdb教程_数据库

8.2.2 复合索引

MongoDB还支持多个字段的用户定义索引，即复合索引（Compound Index）。

复合索引中列出的字段顺序具有重要意义。例如，如果复合索引由 { userid: 1, score: -1 } 组成，则索引首先按 userid 正序排序，然后在每个 userid 的值内，再在按 score 倒序排序。

mongdb 数据分析 mongdb教程_字段_02

8.2.3 其他索引

地理空间索引（Geospatial Index）、文本索引（Text Indexes）、哈希索引（Hashed Indexes）。

地理空间索引（Geospatial Index）。为了支持对地理空间坐标数据的有效查询，MongoDB 提供了两种特殊的索引，返回结果时使用平面几何的二维索引和返回结果时使用球面几何的二维球面索引。
文本索引（Text Indexes）。MongoDB 提供了一种文本索引类型，支持在集合中搜索字符串内容。这些文本索引不存储特定于语言的停止词（例如"the"、“a”、“or”），而将集合中的词作为词干，只存储根词。
哈希索引（Hashed Indexes）。为了支持基于散列的分片，MongoDB 提供了散列索引类型，它对字段值的散列进行索引。这些索引在其范围内的值分布更加随机，但只支持相等匹配，不支持基于范围的查询。

8.3 索引的管理操作

8.3.1 索引查看

返回一个集合中的所有索引的数组

db.collection.getIndexs()

查看 comment 集合中所有的索引情况

> db.comment.getIndexes()
[ { "v" : 2, "key" : { "_id" : 1 }, "name" : "_id_" } ]

结果中显示的是默认 _id 索引。

默认 _id 索引：MongoDB 在创建集合的过程中，在 _id 字段上创建一个唯一的索引，默认名字为 id ，该索引可防止客户端插入两个具有相同值的文档，不能在 _id 字段上删除此索引。

注意：该索引是唯一索引，因此值不能重复，即 _id 值不能重复的。在分片集群中，通常使用 _id 作为片键。

8.3.2 索引创建

在集合上创建索引，语法结构：

db.collection.createIndex(keys, options)

参数说明：

参数	类型	说明
keys	document	包含字段和值对的文档，其中字段是索引键，值描述该字段的索引类型。对于字段上的升序索引，请指定值1；对于降序索引，请指定值-1。MongoDB 支持几种不同的索引类型，包括文本、地理空间和哈希索引。
options	document	可选。包含一组控制索引创建的选项的文档。

options 列表

参数	类型	说明
background	Boolean	建索引过程会阻塞其它数据库操作，background 可指定以后台方式创建索引，即增加 “background” 可选参数。“background” 默认值为false。
unique	Boolean	建立的索引是否唯一。指定为true创建唯一索引。默认值为false。
name	string	索引的名称。如果未指定，MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups	Boolean	3.0+版本已废弃。在建立唯一索引时是否删除重复记录，指定 true 创建唯一索引。默认值为 false。
sparse	Boolean	对文档中不存在的字段数据不启用索引；这个参数需要特别注意，如果设置为 true 的话，在索引字段中不会查询出不包含对应字段的文档.。默认值为 false。
expireAfterSeconds	integer	指定一个以秒为单位的数值，完成 TTL 设定，设定集合的生存时间。
v	index version	索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weights	document	索引权重值，数值在 1 到 99,999 之间，表示该索引相对于其他索引字段的得分权重。
default_language	string	对于文本索引，该参数决定了停用词及词干和词器的规则的列表。默认为英语。
language_override	string	对于文本索引，该参数指定了包含在文档中的字段名，语言覆盖默认的 language，默认值为 language。

注意
在 3.0.0 版本前创建索引方法为 db.collection.ensureIndex() ，之后的版本使用了 db.collection.createIndex() 方法，ensureIndex() 还能用，但只是 createIndex() 的别名。

( 1 ) 单字段索引示例，对 userid 字段建立索引：

# 
> db.comment.createIndex({userid:1})
{
	"numIndexesBefore" : 1,
	"numIndexesAfter" : 2,
	"createdCollectionAutomatically" : false,
	"ok" : 1
}

# 参数1：按升序创建索引
> db.comment.getIndexes()
[
	{
		"v" : 2,
		"key" : {
			"_id" : 1
		},
		"name" : "_id_"
	},
	{
		"v" : 2,
		"key" : {
			"userid" : 1
		},
		"name" : "userid_1"
	}
]

索引名称为 userid_1

mongdb 数据分析 mongdb教程_数据_03

( 2 ) 复合索引：对 userid 和 nickname 同时建立复合（Compound）索引

> db.comment.createIndex({userid:1,nickname:-1})
{
	"numIndexesBefore" : 2,
	"numIndexesAfter" : 3,
	"createdCollectionAutomatically" : false,
	"ok" : 1
}

# 查看索引 userid_1_nickname_-1
> db.comment.getIndexes()
[
	{
		"v" : 2,
		"key" : {
			"_id" : 1
		},
		"name" : "_id_"
	},
	{
		"v" : 2,
		"key" : {
			"userid" : 1
		},
		"name" : "userid_1"
	},
	{
		"v" : 2,
		"key" : {
			"userid" : 1,
			"nickname" : -1
		},
		"name" : "userid_1_nickname_-1"
	}
]

索引名称为 userid_1_nickname_-1

mongdb 数据分析 mongdb教程_字段_04

8.3.3 索引移除

可以移除指定的索引，或移除所有索引

( 1 ) 指定索引的移除

语法结构

db.collection.dropIndex(index)

参数

参数	类型	说明
index	string or document	指定要删除的索引。可以通过索引名称或索引规范文档指定索引。若要删除文本索引，请指定索引名称。

示例：

# 删除 comment 集合中 userid 字段上的升序索引
> db.comment.dropIndex({userid:1})
{ "nIndexesWas" : 3, "ok" : 1 }

( 1 ) 所有索引的移除
语法结构

db.collection.dropIndexes()

示例:

> db.comment.dropIndexes()
{
	"nIndexesWas" : 2,
	"msg" : "non-_id indexes dropped for collection",
	"ok" : 1
}

注意：_id 的字段的索引是无法删除的，只能删除非 _id 字段的索引

8.4 索引的使用

8.4.1 执行计划

分析查询性能（Analyze Query Performance）通常使用执行计划（解释计划、Explain Plan）来查看查询的情况，如查询耗费的时间、是否基于索引查询等。

语法结构：

db.collection.find(query,options).explain(options)

示例：查看根据userid查询数据的情况

> db.comment.find({userid:"1003"}).explain()
{
	"explainVersion" : "1",
	"queryPlanner" : {
		"namespace" : "articledb.comment",
		"indexFilterSet" : false,
		"parsedQuery" : {
			"userid" : {
				"$eq" : "1003"
			}
		},
		"queryHash" : "37A12FC3",
		"planCacheKey" : "4A7D843D",
		"maxIndexedOrSolutionsReached" : false,
		"maxIndexedAndSolutionsReached" : false,
		"maxScansToExplodeReached" : false,
		"winningPlan" : {
			"stage" : "COLLSCAN",
			"filter" : {
				"userid" : {
					"$eq" : "1003"
				}
			},
			"direction" : "forward"
		},
		"rejectedPlans" : [ ]
	},
	"command" : {
		"find" : "comment",
		"filter" : {
			"userid" : "1003"
		},
		"$db" : "articledb"
	},
	"serverInfo" : {
		"host" : "192.168.0.105",
		"port" : 27017,
		"version" : "5.0.0",
		"gitVersion" : "1184f004a99660de6f5e745573419bda8a28c0e9"
	},
	"serverParameters" : {
		"internalQueryFacetBufferSizeBytes" : 104857600,
		"internalQueryFacetMaxOutputDocSizeBytes" : 104857600,
		"internalLookupStageIntermediateDocumentMaxSizeBytes" : 104857600,
		"internalDocumentSourceGroupMaxMemoryBytes" : 104857600,
		"internalQueryMaxBlockingSortMemoryUsageBytes" : 104857600,
		"internalQueryProhibitBlockingMergeOnMongoS" : 0,
		"internalQueryMaxAddToSetBytes" : 104857600,
		"internalDocumentSourceSetWindowFieldsMaxMemoryBytes" : 104857600
	},
	"ok" : 1
}

关键点看： “stage” : “COLLSCAN”, 表示全集合扫描。使用 compass 查看：

mongdb 数据分析 mongdb教程_mongodb_05

对 userid 建立索引

> db.comment.createIndex({userid:1})
{
	"numIndexesBefore" : 1,
	"numIndexesAfter" : 2,
	"createdCollectionAutomatically" : true,
	"ok" : 1
}

再次查询执行计划

> db.comment.find({userid:"1003"}).explain()
{
	"explainVersion" : "1",
	"queryPlanner" : {
		"namespace" : "test.comment",
		"indexFilterSet" : false,
		"parsedQuery" : {
			"userid" : {
				"$eq" : "1003"
			}
		},
		"queryHash" : "37A12FC3",
		"planCacheKey" : "3B74CBDE",
		"maxIndexedOrSolutionsReached" : false,
		"maxIndexedAndSolutionsReached" : false,
		"maxScansToExplodeReached" : false,
		"winningPlan" : {
			"stage" : "FETCH",
			"inputStage" : {
				"stage" : "IXSCAN",
				"keyPattern" : {
					"userid" : 1
				},
				"indexName" : "userid_1",
				"isMultiKey" : false,
				"multiKeyPaths" : {
					"userid" : [ ]
				},
				"isUnique" : false,
				"isSparse" : false,
				"isPartial" : false,
				"indexVersion" : 2,
				"direction" : "forward",
				"indexBounds" : {
					"userid" : [
						"[\"1003\", \"1003\"]"
					]
				}
			}
		},
		"rejectedPlans" : [ ]
	},
	"command" : {
		"find" : "comment",
		"filter" : {
			"userid" : "1003"
		},
		"$db" : "test"
	},
	"serverInfo" : {
		"host" : "192.168.0.105",
		"port" : 27017,
		"version" : "5.0.0",
		"gitVersion" : "1184f004a99660de6f5e745573419bda8a28c0e9"
	},
	"serverParameters" : {
		"internalQueryFacetBufferSizeBytes" : 104857600,
		"internalQueryFacetMaxOutputDocSizeBytes" : 104857600,
		"internalLookupStageIntermediateDocumentMaxSizeBytes" : 104857600,
		"internalDocumentSourceGroupMaxMemoryBytes" : 104857600,
		"internalQueryMaxBlockingSortMemoryUsageBytes" : 104857600,
		"internalQueryProhibitBlockingMergeOnMongoS" : 0,
		"internalQueryMaxAddToSetBytes" : 104857600,
		"internalDocumentSourceSetWindowFieldsMaxMemoryBytes" : 104857600
	},
	"ok" : 1
}

关键点看： “stage” : “IXSCAN” ,基于索引的扫描。

使用 compass 查看：

mongdb 数据分析 mongdb教程_mongdb 数据分析_06

8.4.2 涵盖的查询

当查询条件和查询的投影仅包含索引字段时，MongoDB 直接从索引返回结果，而不扫描任何文档或将文档带入内存。这些覆盖的查询可以非常有效。

mongdb 数据分析 mongdb教程_字段_07

示例：

> db.comment.find({userid:"1003"},{userid:1,nickname:1,_id:0})
{ "userid" : "1003", "nickname" : "凯撒" }
{ "userid" : "1003", "nickname" : "凯 撒" }

> db.comment.find({userid:"1003"},{userid:1,nickname:1,_id:0}).explain()
{
	"explainVersion" : "1",
	"queryPlanner" : {
		"namespace" : "articledb.comment",
		"indexFilterSet" : false,
		"parsedQuery" : {
			"userid" : {
				"$eq" : "1003"
			}
		},
		"queryHash" : "8D35EB98",
		"planCacheKey" : "0B7A4BF3",
		"maxIndexedOrSolutionsReached" : false,
		"maxIndexedAndSolutionsReached" : false,
		"maxScansToExplodeReached" : false,
		"winningPlan" : {
			"stage" : "PROJECTION_COVERED",
			"transformBy" : {
				"userid" : 1,
				"nickname" : 1,
				"_id" : 0
			},
			"inputStage" : {
				"stage" : "IXSCAN",
				"keyPattern" : {
					"userid" : 1,
					"nickname" : -1
				},
				"indexName" : "userid_1_nickname_-1",
				"isMultiKey" : false,
				"multiKeyPaths" : {
					"userid" : [ ],
					"nickname" : [ ]
				},
				"isUnique" : false,
				"isSparse" : false,
				"isPartial" : false,
				"indexVersion" : 2,
				"direction" : "forward",
				"indexBounds" : {
					"userid" : [
						"[\"1003\", \"1003\"]"
					],
					"nickname" : [
						"[MaxKey, MinKey]"
					]
				}
			}
		},
		"rejectedPlans" : [
			{
				"stage" : "PROJECTION_SIMPLE",
				"transformBy" : {
					"userid" : 1,
					"nickname" : 1,
					"_id" : 0
				},
				"inputStage" : {
					"stage" : "FETCH",
					"inputStage" : {
						"stage" : "IXSCAN",
						"keyPattern" : {
							"userid" : 1
						},
						"indexName" : "userid_1",
						"isMultiKey" : false,
						"multiKeyPaths" : {
							"userid" : [ ]
						},
						"isUnique" : false,
						"isSparse" : false,
						"isPartial" : false,
						"indexVersion" : 2,
						"direction" : "forward",
						"indexBounds" : {
							"userid" : [
								"[\"1003\", \"1003\"]"
							]
						}
					}
				}
			}
		]
	},
	"command" : {
		"find" : "comment",
		"filter" : {
			"userid" : "1003"
		},
		"projection" : {
			"userid" : 1,
			"nickname" : 1,
			"_id" : 0
		},
		"$db" : "articledb"
	},
	"serverInfo" : {
		"host" : "192.168.0.105",
		"port" : 27017,
		"version" : "5.0.0",
		"gitVersion" : "1184f004a99660de6f5e745573419bda8a28c0e9"
	},
	"serverParameters" : {
		"internalQueryFacetBufferSizeBytes" : 104857600,
		"internalQueryFacetMaxOutputDocSizeBytes" : 104857600,
		"internalLookupStageIntermediateDocumentMaxSizeBytes" : 104857600,
		"internalDocumentSourceGroupMaxMemoryBytes" : 104857600,
		"internalQueryMaxBlockingSortMemoryUsageBytes" : 104857600,
		"internalQueryProhibitBlockingMergeOnMongoS" : 0,
		"internalQueryMaxAddToSetBytes" : 104857600,
		"internalDocumentSourceSetWindowFieldsMaxMemoryBytes" : 104857600
	},
	"ok" : 1
}

关键点看：“stage” : “PROJECTION_COVERED”。

使用 Compass 查看

mongdb 数据分析 mongdb教程_数据_08

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：android端指定声卡录音声卡手机录音

下一篇：Hadoop全分布式jps hadoop中分布式计算怎么实现

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯