SearchRequest聚合 aggregate聚合

转载

mob64ca140bbb8b 2024-05-09 09:46:19

文章标签 SearchRequest聚合字段数据数组 文章分类 架构后端开发

• 聚合(aggregate)主要用于计算数据，类似sql中的sum()、avg()
• 语法：db.集合名称.aggregate({管道:{表达式}})
管道
• 管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的输入
ps ajx | grep mongo
• 常用管道
• $group：将集合中的文档分组，可用于统计结果
• $match：过滤数据，只输出符合条件的文档
• $project：修改输入文档的结构，如重命名、增加、删除字段、创建计算结果
• $sort：将输入文档排序后输出
• $limit：限制聚合管道返回的文档数
• $skip：跳过指定数量的文档，并返回余下的文档
• $unwind：将数组类型的字段进行拆分
 
表达式：处理输入文档并输出
• 语法：表达式:'$列名'
常用表达式
• $sum：计算总和，$sum:1 表示以一倍计数
• $avg：计算平均值
• $min：获取最小值
• $max：获取最大值
• $push：在结果文档中插入值到一个数组中
• $first：根据资源文档的排序获取第一个文档数据
• $last：根据资源文档的排序获取最后一个文档数据
 
$group
• 将集合中的文档分组，可用于统计结果
• _id表示分组的依据，使用某个字段的格式为'$字段'
• 例1：统计男生、女生的总人数
db.stu.aggregate(
     {$group:
         {
             _id:'$gender',
             counter:{$sum:1}
         }
     }
 )Group by null
• 将集合中所有文档分为一组
• 例2：求学生总人数、平均年龄
db.stu.aggregate(
     {$group:
         {
             _id:null,
             counter:{$sum:1},
            avgAge:{$avg:'$age'}
         }
     }
 )透视数据
• 例3：统计学生性别及学生姓名
db.stu.aggregate(
     {$group:
         {
             _id:'$gender',
             name:{$push:'$name'}
         }
     }
 )• 使用$$ROOT可以将文档内容加入到结果集的数组中，代码如下
 db.stu.aggregate(
     {$group:
         {
             _id:'$gender',
             name:{$push:'$$ROOT'}
         }
     }
 )  
$match
• 用于过滤数据，只输出符合条件的文档
• 使用MongoDB的标准查询操作
• 例1：查询年龄大于20的学生
db.stu.aggregate(
     {$match:{age:{$gt:20}}}
 )  
$project
• 修改输入文档的结构，如重命名、增加、删除字段、创建计算结果
• 例1：查询学生的姓名、年龄
db.stu.aggregate(
    {$project:{_id:0,name:1,age:1}}
 )  
$sort
• 将输入文档排序后输出
• 例1：查询学生信息，按年龄升序
b.stu.aggregate({$sort:{age:1}})
  
$limit
• 限制聚合管道返回的文档数
• 例1：查询2条学生信息
db.stu.aggregate({$limit:2})
$skip
• 跳过指定数量的文档，并返回余下的文档
• 例2：查询从第3条开始的学生信息
db.stu.aggregate({$skip:2})
• 例3：统计男生、女生人数，按人数升序，取第二条数据
db.stu.aggregate(
    {$group:{_id:'$gender',counter:{$sum:1}}},
     {$sort:{counter:1}},
     {$skip:1},
     {$limit:1}
 )• 注意顺序：先写skip，再写limit
  
  
$unwind
• 将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值
语法1对某字段值进行拆分
db.集合名称.aggregate({$unwind:'$字段名称'})
• 构造数据
db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})
• 查询
db.t2.aggregate({$unwind:'$size'})
语法2对某字段值进行拆分
• 处理空数组、非数组、无字段、null情况
• 属性preserveNullAndEmptyArrays值为false表示丢弃属性值为空的文档
• 属性preserveNullAndEmptyArrays值为true表示保留属性值为空的文档
db.inventory.aggregate({
     $unwind:{
         path:'$字段名称',
        preserveNullAndEmptyArrays:<boolean> #防止数据丢失
     }
 })  
• 构造数据
db.t3.insert([
 { "_id" : 1, "item" : "a", "size": ["S", "M", "L"] },
 { "_id" : 2, "item" : "b", "size" : [ ]},
 { "_id" : 3, "item" : "c", "size":"M" },
 { "_id" : 4, "item" : "d" },
 { "_id" : 5, "item" : "e", "size" :null }
 ])• 使用语法1查询
db.t3.aggregate({$unwind:'$size'})
• 查看查询结果，发现对于空数组、无字段、null的文档，都被丢弃了
• 问：如何能不丢弃呢？
• 答：使用语法2查询
 db.t3.aggregate({$unwind:{path:'$size',preserveNullAndEmptyArrays:
 true}})

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。