老湿:什么是加权平均?_java

平均数是一个非常重要而又有广泛用途的概念,在日常生活中,我们经常会听到这样一些名词:平均气温、平均降雨量、平均产量、人均年收入等;而平均分数、平均年龄、平均身高等名词更熟悉。

平均数是表示一组数据集中趋势的一项指标,它等于一组数据中所有数据之和再除以这组数据的个数。

一般来说,平均数反映了一组数据的一般水平,利用平均数,可以从横向和纵向两个方面对事物进行分析比较,从而得出结论。

首先是横向比较。例如,要想比较同一年级的两个班同学学习成绩,如果用每个班的总成绩进行比较,会由于班级人数不同,而使比较失去真正意义。但是如果用平均分数去比较,就可以把各班的平均水平呈现出来。

其次是纵向比较,可以对同一个事物在不同的时间内的情况利用平均数反映出来。例如,通过两个不同年份的人均年收入来比较人们生活水平、经济发展等状况。

平均数分为算术平均数、加权平均数、几何平均数、调和平均数、平方平均数、指数平均数,其中算术平均数、加权平均数是工作中常用的。

算术平均数 

算术平均数是指在一组数据中所有数据之和再除以数据的个数。把n个数的总和除以n,所得的商叫做这n个数的算术平均数。

老湿:什么是加权平均?_java_02

我们来看个例子,这张表有19个学生的某科的成绩,我们可以用透视表统计下这些学生的平均成绩为83.8分,这个就是算术平均法。

老湿:什么是加权平均?_java_03 


加权平均数

我们先来了解下什么是权?

权的古代含义为秤砣,就是秤上可以滑动以观察重量的那个铁疙瘩。在现代,我们把在一组数据里,一个数据出现的次数称为权,也就是权重。

所以加权平均数是各组不同比重平均数的平均数,也就是将各组平均数按照合理的比例进行加权计算平均数。

数据的权能够反映数据的相对重要程度,权越大,对平均数的影响就越大。

刚才学生成绩的例子中,我们再来按性别分组统计下平均数

老湿:什么是加权平均?_java_04

可以得到男、女两组的学生数、分组成绩总分、平均成绩。男同学平均成绩84.6分,女同学平均成绩82.6分,如果直接把男、女同学平均成绩相加除以2,得到的结果是83.6分,与之前算的83.8分不等。别小看这点差异,现在是数据量小,差别不大,但数据量大的时候,差异可能就会显现出来。

我们来看看为什么不等?

男同学有12个人,女同学7个人,相当于男同学有12个84.6分,而女同学有7个82.6分,看到没有,12的影响大于7个影响,这个就是权重,如果男同学也是7个,那么男、女同学平均成绩就可以直接相加除以2。但现在不行,现在男同学比女同学多5个,那要怎么算全班同学平均成绩呢?

就是加权计算:

全班同学平均成绩=84.6*12+82.6*7)/(12+7)=83.8

所以我们可以知道,算术平均数是加权平均数的一种特殊情况,它特殊在各组的权重相等,此时加权平均数就是算术平均数。在实际问题中,当各组权重不相等时,计算平均数时就要采用加权平均数,当各组权重相等时,计算平均数就可以直接采用算术平均数。


-------------------

1GB Python数据分析资料送给大家


长按识别下方二维码,并关注公众号,回复“PY”领取1GB Python数据分析资料

老湿:什么是加权平均?_java_05

1.回复“PY”领取1GB Python数据分析资料

2.回复“BG”领取5GB 名企数据分析报告