3.1数据的预处理

      数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。

机器学习数据预处理包括哪些内容 数据预处理题目_机器学习数据预处理包括哪些内容

     3.1.2数据筛选
数据筛选(data filter)是根据需要找出符合特定条件的某类数据。比如,找出销售额在1000万元以上的企业;找出考试成绩在90分以上的学生;等等。

数据筛选可借助计算机自动完成。下面通过一个简单的例子说明用Excel进行数据筛选的过程。

       表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生、英语成绩最高的前三名学生,四门课程成绩都大于70分的学生。

机器学习数据预处理包括哪些内容 数据预处理题目_预处理_02

 

 

机器学习数据预处理包括哪些内容 数据预处理题目_机器学习数据预处理包括哪些内容_03

3-1

机器学习数据预处理包括哪些内容 数据预处理题目_数据_04

3-2

机器学习数据预处理包括哪些内容 数据预处理题目_预处理_05

统计学成绩等于75

机器学习数据预处理包括哪些内容 数据预处理题目_数据_06

筛选出英语成绩最高的三名学生

机器学习数据预处理包括哪些内容 数据预处理题目_预处理_07

机器学习数据预处理包括哪些内容 数据预处理题目_数据_08

 

如果要筛选出四门课程成绩都大于70分的学生,由于设定的条件比较多,需要使用【高级筛选】命令。使用高级筛选时,必须建立条件区域。、

这时需要在数据清单上面至少留出三行作为条件区域。然后选择【数据】→【高级】。在列表区域输入要筛选的数据区域;在条件区域输入条件区域。出现的界面所示。

机器学习数据预处理包括哪些内容 数据预处理题目_机器学习数据预处理包括哪些内容_09

机器学习数据预处理包括哪些内容 数据预处理题目_数据_10