先从一个日常问题入手
我们假设 (以下均为假设概率,方便理解没有任何实际意义)
A事件为:一个人得癌症。
B事件为:一个人吸烟。
P(A) 为一个人得癌症的概率。 假设为1%。
P(B) 为一个人吸烟的概率。假设为2%。
现在你是一名医生,此时一个人来看病,疑似癌症。则根据先验概率(就是上面假设的已知情况),此人得癌症的概率为 1%。 经过你这位老中医一顿望闻问切, 了解到这个人吸烟。现在请问这个人得癌的概率是多少?
根据概率算法, 一个人得癌,又同时吸烟,则 P = P(A)*P(B) = 0.02% 。
是这样么? 感觉上应该不像, 因为这个情况,与我们初中生物学习遗传特性即是双眼皮、又是血型A的概率不大一样,遗传占比的概率计算上是独立的,可以直接相乘。
但我们知道吸烟与癌症有一定的关系, 假设得已知得癌症的人,吸烟的人占比50%。
所以P(A|B) (代表得知吸烟后得癌的概率,即在B消息出现后,A事件的概率) 应该得另有计算方法。
如图,我们从理论上看下这个问题。
P(A ∩ B) (为A和B交集部分)
= P(A) * P(B|A) ( P(B|A)代表,A的样本中, B的占比; 或事件B的概率,在A事件出现后的发生概率)
= P(B) * P(A|B) (同上,站在B的角度)
则推导 P(A|B) = P(A) * (P(B|A) / P(B))
回到医生问题上, P(A|B) 代表医生得吸病人吸烟后,重新评估其得癌症的概率。
P(A) 代表普通人得癌的概率 1%
P(B|A) / P(B) 代表其于新的消息,对已有的先验概率的修正。 50% / 2%。
则此时 P(A|B) = 1% * (50% / 2%) = 25%。
妈呀, 这个概率一下子提升了这么高! 是的, 这说明这两个事件关联性非常强, 做为医生的你,因为懂得这个理论,对于一类病症,能找出关系性非常大的一系列表现,看病非常准,而被称为这神医。
这个分析过程,即被称为贝叶斯分析
难道这就是用于人工智能的贝叶斯分析?每个人大脑中都有的贝叶斯?
是的,原理就是这样,贝叶斯人就不介绍了,百度即可。
贝叶斯分析思路,对于积累证据来推测一个事物的发生概率具有非常大的作用。当我们要预测一个事件时,我们需要根据这个事件已有的先验概率,然后在证据不断积累的情况下,调整这个事件的发生概率。通过积累证据来得到一个事件发生概率的过程,被称为贝叶斯分析。
如在智能机器人识别你今天的心情,根据已有经验,生气概率为25%。 此时机器人听到你说话的语气很怪,又通过面部识别,发现你的脸比平时长了1cm, 于是机器人通过一系统程序员已写好的代码运算,判断你今天生气的概率为95%,于是乖乖的躲在角落,以免殃及池鱼。
好,说了这么多废话,来道题目检测学习情况
一机器在良好状态生产合格产品几率是 90%,在故障状态生产合格产品几率是 30%,机器良好的概率是 75%。若一日第一件产品是合格品,那么此日机器良好的概率是多少。
A:代表机器良好
B:第一台产品良好
P(A) :代表机器良好概率, 毫无疑问 75%
P(B):代表生产第一台为良品的概率 = 0.75 * 0.9 + 0.25 * 0.3 = 0.75
P(B|A):代表机器良好时,生产合格产品的概率 = 0.9
则P(A|B) = P(A) * (P(B|A)/ P(B)) = 0.75 * 0.9 / 0.75 = 0.9 = 90%