年龄性别频数匹配R语言 spss性别年龄

转载

码海无压 2023-10-20 11:34:53

文章标签 年龄性别频数匹配R语言学习数据集数据文件数据 文章分类 R语言后端开发

第一节数据转置

以下图数据结构为主进行处理：

年龄性别频数匹配R语言 spss性别年龄_数据

（行标为各观测值，列标为各变量）

首先选择菜单中“数据”-“转置”

年龄性别频数匹配R语言 spss性别年龄_数据集_02

其次，选中名称变量“问卷编号”作为列变量，选中“性别、年龄等作为行变量。

年龄性别频数匹配R语言 spss性别年龄_学习_03

最后得到的数据结构如图所示。（行标为各变量，列标为各观测值）

年龄性别频数匹配R语言 spss性别年龄_年龄性别频数匹配R语言_04

第二节样本筛选

首先选择菜单中“数据”-“选择个案”菜单。

年龄性别频数匹配R语言 spss性别年龄_学习_05

弹出如下对话框。其中“选择”参数中：“所有个案”表明不筛选；“如果条件满足”表明按照一定的规则（筛选条件）进行筛选；“随机个案样本”表明按某个百分比或随机精确抽取一定量的观测值；“基于时间或个案范围”表明按顺序抽样；“使用过滤变量”表明用指定过滤变量进行观测筛选（前提是数据文件中存在一个只含有0和1的变量）

（1）满足年龄>30岁的观测值筛选条件。

年龄性别频数匹配R语言 spss性别年龄_数据_06

年龄性别频数匹配R语言 spss性别年龄_年龄性别频数匹配R语言_07

结果示例如下：

年龄性别频数匹配R语言 spss性别年龄_数据集_08

（2）筛选30%的随机个案样本。

年龄性别频数匹配R语言 spss性别年龄_数据_09

年龄性别频数匹配R语言 spss性别年龄_学习_10

结果示例如下：

年龄性别频数匹配R语言 spss性别年龄_学习_11

（3）筛选范围是20-30的个案样本。

年龄性别频数匹配R语言 spss性别年龄_数据文件_12

年龄性别频数匹配R语言 spss性别年龄_数据文件_13

其中“输出”参数中有三个选项：“过滤掉未选定的个案数”将在原数据集未被选择的观测序号打上一个斜线，但观测值并未从文件中删除；“将选定个案复制到新数据集”将重命名生成一个新数据集；“删除未选定的个案”将删除未被选择的观测序号，也没有生成一个新数据集。

（1）将选定个案复制到新数据集

年龄性别频数匹配R语言 spss性别年龄_数据文件_14

年龄性别频数匹配R语言 spss性别年龄_学习_15

（2）删除未选定的个案

年龄性别频数匹配R语言 spss性别年龄_数据文件_16

年龄性别频数匹配R语言 spss性别年龄_数据文件_17

第三节分类汇总

分类汇总是指以指定的一个或者多个分类变量为分类依据（分组变量），将另一个或者多个变量的数据按照分类结果进行描述统计（max\min\sum\sd\med\adv等）。

首先选择“数据”-“汇总”菜单。

年龄性别频数匹配R语言 spss性别年龄_学习_18

弹出对话框后，分别选择“性别”和“学生类型”作为第一组和第二组分组变量。再选择汇总变量为“成绩”的相关函数。

年龄性别频数匹配R语言 spss性别年龄_数据集_19

年龄性别频数匹配R语言 spss性别年龄_数据文件_20

然后将个案数命名为“组”，最终得到如下汇总结果。

年龄性别频数匹配R语言 spss性别年龄_年龄性别频数匹配R语言_21

另外，在“保存”参数中，可以选择“将汇总变量添加到活动数据集”：不产生新的数据文件，将汇总结果添加到当前工作文件中；“创建只包含汇总变量的新数据集”：可以命名新数据集名称，只包含汇总变量及运算结果，直接打开但并不保存；“写入只包含汇总变量的新数据文件”：将汇总结果保存到当前目录下新数据文件中，不打开。

（1）创建只包含汇总变量的新数据集

年龄性别频数匹配R语言 spss性别年龄_学习_22