Power Query中的分组依据,类似于Excel中的分类汇总功能,可以按照某一分类对某列数据或某几列数据进行去重操作和聚合计算(求和、计数、求平均、非重复行计数等),并在去重的过程中将其他数据列按照用户指定的方式对其进行聚合以便生成与依据列相对应的数据

练习案例

数据源

根据输入的小组人数和名单随机分组Python 输入分组依据_Power

问题:按照产品名称统计总销售金额

具体操作步骤如下所示

步骤1:将数据源导入到Power BI Desktop,单击【转换数据】选项,进入Power Query查询编辑器界面

根据输入的小组人数和名单随机分组Python 输入分组依据_数据源_02

步骤2:在Power Query查询编辑器中,选择【转换】|【分组依据】选项,弹出"分组依据"命令窗口,选择"基本"和"产品","新列名"输入"总销售额","操作"选择"求和","柱"选择"销售额"

根据输入的小组人数和名单随机分组Python 输入分组依据_Power BI_03

根据输入的小组人数和名单随机分组Python 输入分组依据_数据源_04

步骤3:单击【确定】按钮,分组依据后的结果如下所示

根据输入的小组人数和名单随机分组Python 输入分组依据_Power_05

分组依据的属性设置界面,主要包含4个选项

根据输入的小组人数和名单随机分组Python 输入分组依据_数据源_06

①分组依据:选择以哪个数据列作为分组条件

②新列名:用于承载聚合操作结果的新列名名称,自定义命名即可,但不能和现有的列名重复

③操作:指定具体的聚合操作方法,主要可选有求和、平均值、中值、最大值、最小值、对行进行计数、非重复行计数以及所有行

④柱:指定用于进行聚合计算的数据列,若操作是针对计数,那么柱选项无须填写

如果需要使用多个分组数据列进行数据分类,就需要选择高级分组

数据源

根据输入的小组人数和名单随机分组Python 输入分组依据_数据源_07

问题:按照省份和城市分组求总销售额

具体操作如下所

步骤1:将数据源导入到Power BI Desktop,单击【转换数据】选项,进入Power Query查询编辑器界面

根据输入的小组人数和名单随机分组Python 输入分组依据_数据_08

步骤2:在Power Query查询编辑器中,选择【转换】|【分组依据】选项,弹出"分组依据"命令窗口,选择"高级"和"省份"、"城市","新列名"输入"总销售额","操作"选择"求和","柱"选择"销售额"

根据输入的小组人数和名单随机分组Python 输入分组依据_Power BI_09

步骤3:单击【确定】按钮,分组依据后的结果如下所示 

根据输入的小组人数和名单随机分组Python 输入分组依据_Power_10