一、刻画集中趋势的描述统计量
集中趋势是指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的描述统计量正是要寻找能够反映数据一半水平的“代表值”或“中心值”。
均值(mean)是一种最常用的“代表值”或“中心值”,又称为“算数平均数”,在统计学中有重要的地位,反映了某变量所有取值的集中趋势或平均水平。
均值的数学定义:
式中,n为样本量,xi为各样本值。它表明了均值的以下特点:均值利用了全体数据,代表了数据的一般水平;均值的大小易受数据中极端值的影响。
另外,还有一些刻画数据集中趋势的描述统计量,如中位数(median,即一组数据按升序排序后,处于中间位置上的数据值)、众数(mode,即一组数据中出现次数最多的数据值)等。它们也有各自的特点。在实际应用中,应根据这些统计来那个的不同特点和实际问题选择合理的统计量。
另外,SPSS还能够计算均值标准误差(standard error of mean)。
样本数据是来自总体的,样本的描述统计量可以反映总体数据的特征。但由于抽样误差的存在,使得样本的统计量不一定能够完全准确的反映总体,它与总体的真实值之间总存在一定的差异。样本均值作为抽样样本的平均数也与总体均值之间存在差异。若干次抽样后会得到若干个不同的样本均值,当样本容量足够大时,这些均值服从正态分布,即
式中,μ为总体均值,σ为总体标准差,n为样本量。可见,样本均值与总体均值的平均差异(离散)程度(方差)为。于是,均值标准误差的数学定义为:
因此,均值标准误差是描述样本均值与总体均值之间平均差异程度的统计量。