即:
X和Y有相同的结构的CRF就构成了线性链条件随机场(Linear chain Conditional Random Fields,以下简称 linear-CRF)。
linear-CRF的数学定义:
设
均为线性链表示的随机变量序列,在给定随机变量序列X的情况下,随机变量Y的条件概率分布 构成条件随机场,即满足马尔科性:
则称 为线性链条件随机场。
条件随机场的参数化形式
条件随机场通过定义特征函数和权重系数来转换成机器可以学习的模型。
下面先给出公式,然后进行解释:
式中,tk和sl是特征函数,
和ul是对应的权值.Z(x)是规范化因子,求和是在所有可能的输出序列上进行的上式是线性链条件随机场模型的基本形式,表示给定输入序列x,对输出序列y预测的条件概率。tk是定义在边上的特征函数,称为转移特征,依赖于当前和前一个位置,sl是定义在结点上的特征函数,称为状态特征,依赖于当前位置。两者都依赖于位置,是局部特征函数。通常,特征函数tk和sl取值为1或0;当满足特征条件时取值为1,否则为0。条件随机场完全由特征函数和对应的权值确定。
线性链条件随机场的简化形式
即整理特征函数,将其统一起来。
设有K1个转移特征,K2个状态特征,K=K1 + K2,,记
然后,对转移与状态特征在各个位置i求和,记作
对应的权值为
条件随机场为
以向量形式表示为
则条件随机场的向量形式为
条件随机场的矩阵形式
引进特殊的起点和终点状态标记y0 =start , yn+1=stop。对观测序列x的每一个位置i,定义一个m阶矩阵(m是标记yi取值的个数)
条件概率为