术语解释

数据集(data set): 所有记录的集合
实例或样本: 每一条记录
属性或特征: 例如,西瓜的色泽等称之为一个属性
特征向量: 一条记录,如果在坐标轴上表示,每个西瓜都可以用坐标轴中的一个点表示,一个点也是一个向量,例如(青绿,蜷缩,浊响),即每个西瓜即为一个特征向量
维数: 一个样本的属性(特征)数
分类: 预测值为离散值的问题
回归: 预测值为连续值的问题
归纳: 从特殊到一般的“泛化”过程
演绎(deduction 从一般到特殊的“特化”(specialization)过程
假设空间(hypothesis space), 色泽,根蒂,敲声分别有3,2,2种可能取值,则我们面临的假设空间规模大小为4*3*3+1=37
版本空间(version space)所有假设空间的集合