统计学 statistics

统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

描述统计 descriptive statistics

描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计 inferential statistics

推断统计是研究如何利用样本数据来推断总体特征的统计方法。通过抽取部分样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断。

分类数据 categorical data

分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据变现为类别,使用文字来表述的。【批:在其他统计学教材中多使用定类数据】

顺序变量 rank data

顺序数据是只能归于某一有序列表的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。【批:在其他统计学教材中多使用定序数据】

数值型数据 metric data

数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。【批:在其他统计学教材中多使用定距数据和定比数据,区分是否存在绝对零值的情况】

定型数据/品质数据 qualitative data

分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据。

定量数据/数量数据 quantitative data

数值型数据说明的是现象的数量特征,通常使用数值来表现的,因此也可称为定量数据或数量数据。

观测数据 observational data

观测数据是通过调查或观察而收集到的数据,这类数据实在没有对事物认为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。

实验数据 experimental data

实验数据是在实验中控制实验对象而收集到的数据。

截面数据 cross-sectional data

截面数据似乎在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。

时间序列数据 time series data

时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。

总体 population

总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。

无限总体 infinite population

对于无线总体,每次抽取一个单位,并不影响下一次的抽样结果,因此每次抽样可以看做是独立的。

有限总体 finite population

对于有限总体,抽取一个单位后,总体元素就会减少一个,前一次的抽样结果往往会影响第二次的抽样结果,因此每次抽取式不独立的。

样本 sample / 样本量 sample size

样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。

参数 parameter

参数是用来描述总体特征的概况性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。

统计量 statistic

统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。

变量 variable

变量是说明现象某种特征的概念,其特点似乎从以此观察到下一次观察结果会呈现出差别或变化。

分类变量 categorical variable

分类变量是说明事物类型的一个名称,其取值是分类数据。【批:在其他统计学教材中多数使用定类变量而非分类变量的名称】

定类变量 norminal variable

最低层级的变量类型,不同数字仅作为标志,相互之间没有次序关系。

顺序变量 rank variable

顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。【批:在其他统计学教材中多使用定序变量而非顺序变量】

定序变量 ordinal variable

不同数字不仅作为标志,互相之间也有顺序关系,可以比较大小,但是不能对数据进行四则预算。

数值型变量 metric variable

数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。【批:在其他统计学教材中多使用定距变量和定比变量,而非合并在一起使用数值型变量;定距变量和定比变量在应用时还是有所区别的】

定距数据 interval variable

不同数字之间不仅可以比大小,而且相互之间的距离是有意义的(具有测量单位),可以进行加减运算;但是因为没有绝对零点所以无法进行乘除运算。

定比变量 ratio variable

最高层级的变量类型,存在绝对零点,不同数字之间不仅可以进行加减运算,也可进行乘除运算。

离散型变量 discrete variable

离散型变量是只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举。

连续型变量 continuous variable

连续型变量是可以在一个或多个区间内取任何值的变量,它的取值是连续不断的,不能一一列举。

经验变量 empirical variable

经验变量是指用于描述我们周围可以观察到的事物的变量。

理论变量 theoretical variable

理论变量是指由统计学家用数据方法构造出来的变量,例如z统计量、t统计量、F统计量等。