关系抽取之远程监督算法 (8)

日期：2021-05-07 栏目：程序人生浏览：次

　　这篇论文要解决的问题，就是多实例学习会遗漏大量信息的问题。所以这篇论文用句子级别的注意力机制代替多实例学习，对于包含某实体对的所有句子，给每一个句子计算一个注意力得分，动态地降低标注错误的样本的得分，再进行加权求和，从而充分利用所有句子的信息。

关系抽取之远程监督算法

　　多实例学习相当于硬注意力机制（Hard Attention），而我们耳熟能详的以及论文中用到的注意力机制是选择性注意力机制（Selective Attention）或者说软注意力机制（Soft Attention），所以多实例学习其实是选择性注意力机制的特殊情况（只有一个句子的权重为1，其他全为0）。

　　（二）模型介绍

　　模型主要分为两个部分：句子编码器和注意力层。

　　1、句子编码器

　　句子编码器就是上一篇论文中的PCNN或CNN网络结构，由卷积神经网络的输入层、卷积层、池化层、非线性映射层（或者说激活函数）构成。

　　文本特征同样用词嵌入和位置特征嵌入，池化层用普通的最大池化或者分段最大池化。

　　因此，本文的句子编码器部分输出的是一个句子经过最大池化并且非线性激活后的特征向量，用于输入到注意力层。这部分和上一篇论文基本相同，无须赘述。

关系抽取之远程监督算法