使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式

转载

mob6454cc61981e 2024-03-21 13:37:45

文章标签 使用贝叶斯分类器会产生什么问题机器学习朴素贝叶斯算法算法取值 文章分类 机器学习人工智能

贝叶斯公式

在讨论贝叶斯分类时，我们先要认识贝叶斯公式，其表示意义为：一件事在特定条件下发生的概率。

我们知道，条件概率计算公式为：

B发生条件下，A发生的概率

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_算法

同时，A发生条件下，B发生概率为：

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_朴素贝叶斯算法_02

则有

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_使用贝叶斯分类器会产生什么问题_03

可得

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_使用贝叶斯分类器会产生什么问题_04

这就是常见的贝叶斯公式

贝叶斯决策

贝叶斯决策论是在概率框架下实施决策的基本方法。在分类任务中，在所有相关概率都已知的理想条件下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。

我们可以以一个分类任务为例，

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_取值_05

很明显，此处目标是最小化分类错误率，假设选择0-1损失函数，

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_取值_06

此时条件风险为：

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_朴素贝叶斯算法_07

对于为什么会得到这个式子，举个例子便知

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_机器学习_08

为使得分类错误率最小化，贝叶斯最优分类器可为：

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_朴素贝叶斯算法_09

基于贝叶斯定理

使用贝叶斯分类器会产生什么问题贝叶斯分类器原理公式_朴素贝叶斯算法_10

其中，先验概率Pc可通过样本集中各类样本出现的频率来进行估计，但是后验概率Px|c要运用同样方法估计就很艰难，因为在现实应用中样本的属性都是多值的，那么可能取值将为指数级，如d个属性为二值型，那么可能取值为2的d次方个。对此，我们可以采用极大似然估计的方法，先假定参数服从于一个先验分布，然后基于观测到的数据来计算参数的后验分布，但是这种方法对于分布形式的选取要求较高。