# -*- coding: utf-8 -*-

#1、概念:分组分析,是指根据分组字段,将分析对象划分成不同的部分,以进行对比分析各组之间的差异的一种分析方法。

#定性分组:根据事物的已有类别进行划分,如性别、年龄、地区等

#定量分组:即数值分组,在数据处理章节(python笔记20:数据处理之数据分组)已经学习过

#2、常用的统计指标:计数、求和、平均值等

#3、分组统计函数:

#groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,...].agg({统计列别名1:统计函数1,统计列别名2:统计函数2,...})

#参数说明:

#by:用于分组的列

#中括号:用于统计的列

#agg:统计别名显示统计值的名称,统计函数用于统计数据

import numpy

import pandas

data = pandas.read_csv("D:/python/workspace/pythonStudy/25.csv")

aggResult = data.groupby(by=['class']) ['score'].agg({'总分':numpy.sum,'人数':numpy.size,'平均成绩':numpy.mean})