文章目录
- abstract
- 完备事件组(划分)
- 基本性质
- 全概率公式
- 例
- 贝叶斯公式
- 例
- 对立事件下的常用形式
- 先验概率和后验概率
- 例
- 概率作为衡量人们对客观事件的信念度量
- 补充
- 条件概率的链式法则
- More than two events
- Example
- 例
- More than two random variables(多维随机变量下的链式乘法法则)
- Example
abstract
- 全概率公式和bayes公式及其应用
- 后验概率和信念度量
完备事件组(划分)
- 设有限集
;试验
的样本空间为
- 若
满足:
- 则称
为
的一个完备事件组,也称为划分
基本性质
- 完备事件组
,试验的任意一个样本点(任意一次试验结果)都属于且仅属于某一个
全概率公式
- 设试验E的样本空间为
,
为
的事件
是一个
的划分,
,则
- 那么
- 证明:
- 显然
,又
,所以
,
- 证法1:
- 证法2:
=
=
=
=
例
- 某个含有20个球的箱子
- 含有0,1,2只次品的概率分别为0.8,0.1,0.1
- 记:
={箱子包含的残次品数量为
个}
- 记
={抽中的4件产品都是正品}
- 那么发生事件
的概率?
- 显然
构成试验E{观察箱子中的全部球的正品数,样本空间为{0,1,2}}的样本空间的一个划分
- 而事件
进行的试验
{观察取出的4个抽样品的正品数,样本空间为{0,1,2}}
- 容易根据古典概型公式计算(因为此时的样本空间已知)以下条件概率(这里不是用条件概率公式展开计算,这会绕回来)
- 其中
- 根据全概率公式
- Note:这里试验
的样本空间恰好和E的样本空间重复,但如果箱子中的次品高达4个以上,那么
的样本空间
是包含于
的样本空间的
贝叶斯公式
- bayes公式基于上述的全概率公式,是一个更加综合的公式,但是原理是简单的
- 设试验E的样本空间为
,
为
的事件
是一个
的划分,
,则
=
=
;
;此公式为bayes公式
- 证明:由条件概率,乘法定理,全概率公式,贝叶斯公式显然成立
=
=
- 注意在bayes公式中,我们要求的是
,因而
=
就不合适,否则公式无法有效计算
- 而因该用
=
来算
例
- 次品来源问题:设一批零件来自三个供应商
供应商 | 次品率 | 进货份额 |
1 | 0.02 | 0.15 |
2 | 0.01 | 0.80 |
3 | 0.03 | 0.05 |
- 试验内容:从零件中抽取一件
- A={取到的产品是次品}
={次品零件来自第
个厂商}
=
;
=0.02
=0.80;
=0.01
=0.05;
=0.03
- 求该样品是次品的概率:
- 由全概率公式:
=
- 从中取出一件,发现是次品,那么来自产商
的概率是多少
- 由贝叶斯公式:
- 分别可以计算出:
=
=
对立事件下的常用形式
- 全概率公式和beyes公式在
的时候(事件
构成样本空间的一个划分)最常用
- 此时分别有:
=
=
先验概率和后验概率
例
- 机器与产品合格率问题
- 设机器正常时,生产的产品合格率为0.9,否则合格率为0.3
- 如果机器开机后,正常的概率是0.75(先验概率)
- 某天该机器第一件产品是合格的,机器正常的概率是多少?
- 分析:
- A={第一件产品合格}
- B={机器正常}
- 所求概率表达式为:
- 根据假设可知:
构成了样本空间的一个划分(即机器要么正常,要么不正常)
- 由全概率公式
=
- 那么根据Bayes公式,
=
,
- 即第一件产品合格的条件下,机器正常的后验概率概率为0.9
- 后验概率是对先验概率的一种修正
- 后验概率和先验概率的解释分为两派
- 客观派:所有第一件产品是合格的日子里,100天内平均由90天机器是正常的
- 主观派:反映的是试验前后人们主观上对机器状态的不同信念
概率作为衡量人们对客观事件的信念度量
- 以伊索寓言狼来了为例
={孩子说谎};
={孩子可信},假设一个可信的孩子**相对不容易说谎,**不妨设这个概率为0.1,即
=0.1;反之,一个不可信的孩子说谎话的概率为0.5,即
- 设村民遇到一个可信的孩子的概率为0.8,即
=0.8
- 那么孩子说慌话的概率为
=
=
=0.18
- 现在假设孩子说了谎话一次后,由bayes公式计算这个孩子是可信的概率
=
=
=
=
- 即孩子可信的后验概率降低到了0.444
- 如果孩子再次撒谎,令
按照上述方式再次计算后验概率:
=
=
- 可见,孩子撒了两次慌后,其可信的后验概率已经降低到了0.138,给人的感觉几乎是一个不可信的人
补充
条件概率的链式法则
- Chain rule (probability) - Wikipedia
- In probability theory, the chain rule (also called the general product rule[1][2]) permits the calculation of any member of the joint distribution of a set of random variables using only conditional probabilities.
- The rule is useful in the study of Bayesian networks, which describe a probability distribution in terms of conditional probabilities.
- 更一般的,如果反复套用上述公式,我们可以得到:
- 下面得到公式看起来复杂,其实用起来是很自然
- 其他写法
- 通常,公式右边的条件概率都是比较容易计算的
- 通常利用条件概率的样本收缩来得出各个条件概率因子
- 否则可能要考虑其他的计算积事件的方法
More than two events
- For more than two events
the chain rule extends to the formula
which by induction may be turned into
Example
- With four events (
), the chain rule is
例
- 多次摸多颜色球问题
- 设有5红,3黑,2白
- 问,第三次才摸到白球的概率
- 即,前两次的摸球结果都不是白色的
- 为了方便讨论问题,记:
- 如果不是白球,则记为
- 其中
表示已经有
个求被摸出,现在再摸出一个球,发生事件
的概率
- 例如
表示已经摸出一个球(而且不是白球)的情况下,再摸出一个求,而且仍然不是白球的概率
- 实时上,稍微熟练点的高中生,就可以直接写出
More than two random variables(多维随机变量下的链式乘法法则)
- Consider an indexed collection of random variables
taking possible values
- Then, to find the value of this member of the joint distribution, we can apply the definition of conditional probability to obtain:
- Repeating this process with each final term and letting
denote the event
Example
- With four variables (
), denote
- Then, the chain rule produces this product of conditional probabilities: