第二章
  1. 比较验证
    (1)假设检验
    在包含m个样本的测试集上,泛化错误率为西瓜书第二章学习笔记-下_假设检验的学习器被测得测试错误率为西瓜书第二章学习笔记-下_技术_02的概率是:
    西瓜书第二章学习笔记-下_技术_03
    其中西瓜书第二章学习笔记-下_假设检验_04表示在m个样本中选出西瓜书第二章学习笔记-下_误分类_05个的取法个数。
    西瓜书第二章学习笔记-下_技术_06时,西瓜书第二章学习笔记-下_临界值_07西瓜书第二章学习笔记-下_误分类_08时最大。西瓜书第二章学习笔记-下_假设检验_09越大时西瓜书第二章学习笔记-下_泛化_10越小。
    如在西瓜书第二章学习笔记-下_临界值_11=0.3时,10个样本中测得3个被误分类的概率最大。m=10,西瓜书第二章学习笔记-下_技术_12=0.3时,
    西瓜书第二章学习笔记-下_技术_13
    假设西瓜书第二章学习笔记-下_技术_12西瓜书第二章学习笔记-下_假设检验_15,则在置信度1-α的概率内所能观测到的最大错误率如下式。
    西瓜书第二章学习笔记-下_误分类_16
    即:西瓜书第二章学习笔记-下_技术_17的最大边界为西瓜书第二章学习笔记-下_误分类_18
    时可以使得式子成立。此时,若测试错误率西瓜书第二章学习笔记-下_泛化_19小于临界值西瓜书第二章学习笔记-下_假设检验_20,则可得出结论:在α显著度下,假设“西瓜书第二章学习笔记-下_泛化_21”不能被拒绝。