【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习

文章目录

4.1朴素贝叶斯法的学习与分类


贝叶斯定理


  • 贝叶斯思维
  • 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_02

  • 条件概率
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_03
  • 贝叶斯定理
    已知:
    存在 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_04【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_05 , 给定一个新的实例 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_06
    问:该实例归属第 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_07 类的可能性有多大?
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_08
    即,
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_09
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_10
  • 朴素贝叶斯
    假设:实例特征之间相互独立
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_11
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_12

4.1.1 基本方法


【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_13

  • 训练数据集:
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_14
  • 输入:【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_15
  • 输出:【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_16
    生成方法:学习联合概率分布【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_17
  • 生成方法:学习联合概率分布【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_18
  • 先验概率分布:

【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_19

  • 条件概率分布:

【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_20

  • 联合概率分布:

【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_21
假设是独立的是为了能够计算出来,使其具有可行性

4.1.2 后验概率最大化的含义


  • 后验概率
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_22
  • 朴素贝叶斯法将实例分到后验概率最大的类中。这等价于期望风险最小化。假设选择【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_23损失函数:
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_24
    式中【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_25是分类决策函数。这时,期望风险函数为
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_26
    因为期望的定义是值出现的概率乘以具体值之和,所以上式可转换为损失函数与联合概率之积的积分:
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_27
    期望是对联合分布【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_28取的。由此取条件期望
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_29
    为了使期望风险最小化,只需对【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_30逐个极小化,由此得到:
  • 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_31
  • 这样一来,根据期望风险最小化准则就得到了后验概率最大化准则:
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_32
    即朴素贝叶斯法所采用的原理.

【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_33

4.2 朴素贝叶斯法的参数估计


4.2.1 极大似然估计


  • 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_34可知,学习意味着估计【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_35【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_36
  • 极大似然估计
  1. 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_37【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_38是样本,分子是点的个数
  2. 设第【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_39个特征【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_40可能取值的集合为【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_41, 条件概率【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_42的极大似然估计是
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_43
    式中,【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_44是第【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_45个样本的第【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_39个特征;【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_47是第【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_39个特征可能取的第【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_49个值;【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_50

4.2.2 学习与分类算法


  1. 计算先验概率及条件概率
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_51
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_52
  2. 对于给定实例【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_53,计算
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_54
  3. 确定实例的类
    【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_55

4.2.3 贝叶斯估计


  • 先验概率的贝叶斯估计

【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_56

  • 条件概率的贝叶斯估计

【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_人工智能_57
注: 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_58时为极大似然估计, 【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_59 时为拉普拉斯平滑(Laplacian Smoothing)。
为什么+【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_分类算法_60【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_机器学习_61?
【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_62
为什么+【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯算法_63?
【李航】统计学习方法--4. 朴素贝叶斯法(详细推导)_朴素贝叶斯_64