个体(element):搜集数据的实体
变量(variable):个体中所感兴趣的特征
测量值:每个个体的每一变量的值
观测值(observation):某一个体得到的测量值集合

名义尺度(nominal scale):无顺序无等级,比如:成员,非成员
顺序尺度(ordinal scale):有顺序有等级意义,数据的间隔无意义,比如:A级,B级
间隔尺度(interval scale):具有顺序数据的所有属性,且可以按某一固定度量单位表示数值间隔,比如100分,90分
比率尺度(ratio scale):具有间隔数据的所有属性,且两个数值之比有意义,必须有0值,比如100千克,50千克

分类型数据(categorical data) - 分类变量(categorical variable) - 互相计算无意义
数量型数据(quantitative data) - 数量变量(quantitative variable) - 互相计算有意义

截面数据(cross-sectional data):在相同或近似相同的时间点上搜集的数据
时间序列数据(time series data):在不同时间点上搜集的数据

描述统计(descriptive statistics):将数据以表格、图形或数值形式汇总的统计方法

总体(population):在特定研究中所有感兴趣的个体组成的集合
样本(sample):总体的一个子集

普查(censes):搜集总体全部数据的调查过程
抽样调查(sample survey)搜集样本数据的调查过程
统计推断(statistical inference):利用样本数据对总体特征进行估计和假设检验

逻辑分析方法(analytics):将数据转化为做出好决策见解的科学过程,包含描述性分析,预测性分析,规范性分析
描述性分析(descriptive analytics):包含描述过去发生状况的分析技术集合
预测性分析(predictive analytics):包含利用过去数据建立模型来预测未来或评估一个变量对另一个变量影响的分析技术
规范性分析(prescriptive analytics):产生一个最佳行动过程的分析技术的合集

大数据(big data):3V数据:容量(volume),速度(velocity),种类(variety)
数据挖掘(data mining):从非常大的数据库中开发有用的决策信息的方法