原文:机器学习:《统计学习方法》笔记(二)—— 条件随机场(CRF)

参考:概率无向图模型

1. 概率无向图的因子分解

注:有一点笔者仍然不明白,《统计学习方法》是定义P(Y)的乘积是在最大团上进行,而有材料说明乘积是在极大团上进行。

无向图中的极大团的结点个数可以是不同的,只要满足“不能再加进任何一个结点”的条件,就是极大团。

因子分解是图中所有极大团的势函数的乘积规范化后的结果。计算公式如下

关于条件随机场的一些补充_经验分享

关于条件随机场的一些补充_经验分享_02

关于条件随机场的一些补充_经验分享_03

关于条件随机场的一些补充_经验分享_04

针对上图,最大团有关于条件随机场的一些补充_经验分享_05

联合概率分布为

关于条件随机场的一些补充_经验分享_06
Z为每个节点所在团块的势函数乘积的和

关于条件随机场的一些补充_经验分享_07

上式理解为每个节点所在所有极大团的乘积和,关于条件随机场的一些补充_经验分享_08在C1中,关于条件随机场的一些补充_经验分享_09在C2中,关于条件随机场的一些补充_经验分享_10在C1、C2、C3中,关于条件随机场的一些补充_经验分享_11在C2中,关于条件随机场的一些补充_经验分享_12在C3中。

2. 概率无向图公式P(Y)与条件随机场P(Y|X)的联系

条件随机场是给定X的条件下,随机变量Y的马尔可夫随机场,即Y是满足马尔可夫性的。这里Y的条件概率分成P(Y|X)构成条件随机场。

线性条件随机场中,最大团是关于条件随机场的一些补充_经验分享_13。所以按照概率无向图的因子分解公式,可知

关于条件随机场的一些补充_经验分享_14

关于条件随机场的一些补充_经验分享_15

所以线性条件随机场的参数形式为

关于条件随机场的一些补充_经验分享_16