4.1

        题:试证明对于不含有冲突数据(即特征向量完全相同但标记不同)的训练集,必然存在与训练集一致(即训练误差为0)的决策树。

        答:根据决策树学习基本算法可知:

                1.当前节点包含的样本全属于同一类别,无需划分

                2.当前属性集为空,或者样本所有属性上取值相同,无法划分

            故若两个特征向量完全相同,则决策树有相同点,若特征向量不同,则会出现误差,决策树和训练集不一致。即证

4.2

        题:试分析使用“最小训练误差”作为决策树划分选择准则的缺陷。

学习算法期望找到所有实例中最小错误率的分类器即最小训练误差。故会存在训练集出现过拟合现象

4.3

        题: