title: 斯坦福-随机图模型-week2.3
tags: note
notebook: 6- 英文课程-9-Probabilistic Graphical Models 1: Representation
---

斯坦福-随机图模型-week2.3

局部结构-总论

tabular representation 表格表示

CPD 条件概率分布

我们以前使用表格来描述各个情况的概率,比如这样:

斯坦福NLP标注工具 斯坦福暗示量表_斯坦福NLP标注工具

比如我们讨论学生问题,这个表可以描述智商,难度和得分的关系。

不过在更加复杂的情况,比如分析病情:

斯坦福NLP标注工具 斯坦福暗示量表_概率分布_02

引起咳嗽的情况有很多,比如流感,肺炎,等很多原因。这就说使得表格的形式变得十分的复杂。

为表格的表述造成了很严重的影响。

CPD表示 条件概率表示

为了解决这样的问题,我们使用CPD来进行表示

斯坦福NLP标注工具 斯坦福暗示量表_父节点_03

表示的时候我们也可以使用任何的函数进行表示。

这样进行表示就相对的额简单了。

我们也可以用这个形式表述很多的信息。比如:

  • 确定性的CPD
  • 树形结构的CPD
  • 逻辑CPD和标准化
  • 噪声问题
  • 线性高斯模型 和 标准化

context-specific independence 上下文相关的独立性

C 是变量集,可与 X,Y,Z 相交,满足以下三条等价陈述时称 X 与 Y 在给定 Z 和表示为 (X⊥cY|Z) 的上下文 c 时上下文独立。

斯坦福NLP标注工具 斯坦福暗示量表_父节点_04

举个例子来说, 在或运算中,如何确定事物的独立性呢?

斯坦福NLP标注工具 斯坦福暗示量表_概率分布_05

很显然第三个是正确的。

我们可以分析,当y2=1的时候x一定是1,所以和y1的值是独立的,因此我们应该认为第二个和第三个都是正确的。

树形结构的CPD

先看一个例子

斯坦福NLP标注工具 斯坦福暗示量表_树形结构_06

一个人的工作和他的文化,适应程度和成绩有关。

斯坦福NLP标注工具 斯坦福暗示量表_概率分布_07

我们这样考虑问题,首先看学生是不是适合他的工作,如果他适应了他的工作,那么就考虑他的成绩,每一次考虑我们都会得到一个是不是录用他的概率。

在这个前提下,我们就可以很容易的说明环境特殊独立。

斯坦福NLP标注工具 斯坦福暗示量表_树形结构_08

很很容易发现第一个和第三个由于他们的结构和造成了不相关。
a
在看一个例子

斯坦福NLP标注工具 斯坦福暗示量表_概率分布_09

在这样的一个决策图中,是否得到工作和两个推荐信有关还有他们自己的选择

斯坦福NLP标注工具 斯坦福暗示量表_父节点_10

树形结构是这样的。

总结

已经看到,普通树形 CPD 通过上下文独立性减少了父节点变量,Multiplexer CPD 使得变量在不同情形下依赖于不同父节点。树形 CPD 有其特有的优势。

  • 能挖掘一个变量的父节点之间的依赖关系(贝叶斯网不能);
  • 能有效捕捉 CPD 中的特定上下文独立性:
  • 从而有效减少模型变量个数
  • 进而减少最终的 CPDs 个数

independence of causal influence 因果影响的独立性

noisy OR CPD

我们说有很多的原因会引发感冒, 在这总情况下,我们要建立噪声or模型,讨论。

斯坦福NLP标注工具 斯坦福暗示量表_树形结构_11

其中,x是各个疾病,y是咳嗽。他们都是0-1变量。

z1 代表,他自己就能产生y的概率。其他的也都是。

在从Zi到z的过程中,我们可以使用常用的线性函数进行处理,也可以使用非线性的函数,如sigmod函数进行处理。