假设我们现在有垃圾邮件样本、正常邮件样本、测试邮件,其中

垃圾邮件样本
1.点击、更多、信息
2.最新、产品
3. 信息、点击、链接

正常邮件样本
1.开会
2.信息、详见、邮件
3.最新、信息

测试邮件
最新、产品、实惠、点击、链接

下面是计算步骤。

1 条件概率


注: 红色字体为平滑操作

朴树贝叶斯java 朴素贝叶斯经典例题_先验概率      朴树贝叶斯java 朴素贝叶斯经典例题_先验概率_02

朴树贝叶斯java 朴素贝叶斯经典例题_垃圾邮件_03      朴树贝叶斯java 朴素贝叶斯经典例题_朴树贝叶斯java_04

朴树贝叶斯java 朴素贝叶斯经典例题_垃圾邮件_05      朴树贝叶斯java 朴素贝叶斯经典例题_朴树贝叶斯java_06

朴树贝叶斯java 朴素贝叶斯经典例题_先验概率_07           朴树贝叶斯java 朴素贝叶斯经典例题_垃圾邮件_08

朴树贝叶斯java 朴素贝叶斯经典例题_条件概率_09          朴树贝叶斯java 朴素贝叶斯经典例题_垃圾邮件_10

朴树贝叶斯java 朴素贝叶斯经典例题_先验概率_11          朴树贝叶斯java 朴素贝叶斯经典例题_朴树贝叶斯java_12

朴树贝叶斯java 朴素贝叶斯经典例题_先验概率_13          朴树贝叶斯java 朴素贝叶斯经典例题_条件概率_14

朴树贝叶斯java 朴素贝叶斯经典例题_垃圾邮件_15          朴树贝叶斯java 朴素贝叶斯经典例题_条件概率_16

朴树贝叶斯java 朴素贝叶斯经典例题_垃圾邮件_17          朴树贝叶斯java 朴素贝叶斯经典例题_条件概率_18

2 先验概率


朴树贝叶斯java 朴素贝叶斯经典例题_条件概率_19  朴树贝叶斯java 朴素贝叶斯经典例题_先验概率_20

3 计算


朴树贝叶斯java 朴素贝叶斯经典例题_条件概率_21
注:

  1. 由于 “实惠” 未出现在样本中,因此第二个等号中缺少 P(实惠|正常)
  2. 实际上第二个等号应为约等号
  3. P(新邮件)为标准化常量,难以计算

同理可计算出 P(垃圾|新邮件),将二者比较即可得出预测结果