这是学习笔记的第 2282篇文章
关于贝叶斯公式,已经回炉学习过很多次了,但是感觉还是理解的不够深入,最近又重温了下,发现和工作生活还是很普遍的,可以不断的培养这种思维模式。
我做了如下的两个例子来理解贝叶斯公式。
这个公式看起来比较有逼格。
如果我们换一个角度来看,其实贝叶斯公式是加法公式和乘法公式的综合应用,如:
P(A+B)=P(A)+P(B) A,B互斥
P(AB)=P(A)*P(B|A), P(A)>0
它就好像是一个动态的天平,因为条件的变化而不断保持一种平衡,我来举两个例子。
第1个是出行相关的,我们出门的时候通常会有多云天气,我们想根据日常的一些信息来判断是否会下雨。
-
50%的雨天的早上是多云的!
-
多云的早上其实挺多的(大约40%的日子早上是多云的)!
-
这个月干旱为主(平均30天里一般只有3天会下雨,10%)!
通过这些信息,我们如何得到问题的答案:
今天多云 下雨的概率是多少
我们假设 A为多云,B为下雨,则需要计算的是P(B|A)的值。
A 多云
B 下雨
根据以上的信息,可以得到如下的信息:
P(A|B)=0.5
P(B)=0.1
P(A)=0.4
P(B|A)=P(B)*P(A|B)/P(A)
=0.1*0.5/0.4=0.125
再来一个例子,那就是和判断疾病相关的,一般的课本上都会有一个习题,我们描述下这个问题,假设是张三。
-
对于真的有这种过敏的人,检测有 80% 的机会给回 "有" 的结果;
-
对于没有这种过敏的人,检测有 10% 的机会给回 "有" 的结果(而这种情况,称之为"假阳性")
-
从实际情况看,该地区1% 的人有这种过敏,而张三的检测结果是 "有",那么张三真的有这种过敏的可能性有多大?
我们可以设定两个事件:
A 过敏
B 有
然后根据如上的信息,可以得到如下的信息,当然这次就比较纠结了。
P(B|A)=0.8
P(B|~A)=0.1
P(A)=0.01
P(A|B)=?
好像到了这里,没法直接套用公式了,我们得做下折中。
不过我们可以把有这种过敏和没有这种过敏的概率相加来求这个一般概率:
1% 的人有这种过敏,检测对 80% 的这些人说 "有"
99% 的人没有这种过敏,检测对 10% 的这些人说 "有"
P(B)
=0.01*0.8+0.99*0.1=0.099+0.008
=0.107
P(A|B)=P(A)*P(B|A)/P(B)
=0.01*0.8/0.107
=0.0748
所以整体算下来概率也不高,这个时候再来看公式,其实就是会清晰一些了。