第一节 数据转置
以下图数据结构为主进行处理:
(行标为各观测值,列标为各变量)
首先选择菜单中“数据”-“转置”
其次,选中名称变量“问卷编号”作为列变量,选中“性别、年龄等作为行变量。
最后得到的数据结构如图所示。(行标为各变量,列标为各观测值)
第二节 样本筛选
首先选择菜单中“数据”-“选择个案”菜单。
弹出如下对话框。其中“选择”参数中:“所有个案”表明不筛选;“如果条件满足”表明按照一定的规则(筛选条件)进行筛选;“随机个案样本”表明按某个百分比或随机精确抽取一定量的观测值;“基于时间或个案范围”表明按顺序抽样;“使用过滤变量”表明用指定过滤变量进行观测筛选(前提是数据文件中存在一个只含有0和1的变量)
(1)满足年龄>30岁的观测值筛选条件。
结果示例如下:
(2)筛选30%的随机个案样本。
结果示例如下:
(3)筛选范围是20-30的个案样本。
其中“输出”参数中有三个选项:“过滤掉未选定的个案数”将在原数据集未被选择的观测序号打上一个斜线,但观测值并未从文件中删除;“将选定个案复制到新数据集”将重命名生成一个新数据集;“删除未选定的个案”将删除未被选择的观测序号,也没有生成一个新数据集。
(1)将选定个案复制到新数据集
(2)删除未选定的个案
第三节 分类汇总
分类汇总是指以指定的一个或者多个分类变量为分类依据(分组变量),将另一个或者多个变量的数据按照分类结果进行描述统计(max\min\sum\sd\med\adv等)。
首先选择“数据”-“汇总”菜单。
弹出对话框后,分别选择“性别”和“学生类型”作为第一组和第二组分组变量。再选择汇总变量为“成绩”的相关函数。
然后将个案数命名为“组”,最终得到如下汇总结果。
另外,在“保存”参数中,可以选择“将汇总变量添加到活动数据集”:不产生新的数据文件,将汇总结果添加到当前工作文件中;“创建只包含汇总变量的新数据集”:可以命名新数据集名称,只包含汇总变量及运算结果,直接打开但并不保存;“写入只包含汇总变量的新数据文件”:将汇总结果保存到当前目录下新数据文件中,不打开。
(1)创建只包含汇总变量的新数据集
(2)写入只包含汇总变量的新数据文件