[深度概念]·深度学习之Attention Model（注意力模型）学习笔记 (4)

日期：2022-01-11 栏目：程序人生浏览：次

[深度概念]·深度学习之Attention Model（注意力模型）学习笔记

其中，f2函数代表Encoder对输入英文单词的某种变换函数，比如如果Encoder是用的RNN模型的话，这个f2函数的结果往往是某个时刻输入xi后隐层节点的状态值；g代表Encoder根据单词的中间表示合成整个句子中间语义表示的变换函数，一般的做法中，g函数就是对构成元素加权求和，也就是常常在论文里看到的下列公式：

[深度概念]·深度学习之Attention Model（注意力模型）学习笔记

假设Ci中那个i就是上面的“汤姆”，那么Tx就是3，代表输入句子的长度，h1=f(“Tom”)，h2=f(“Chase”)，h3=f(“Jerry”)，对应的注意力模型权值分别是0.6, 0.2, 0.2，所以g函数就是个加权求和函数。如果形象表示的话，翻译中文单词“汤姆”的时候，数学公式对应的中间语义表示Ci的形成过程类似下图：

[深度概念]·深度学习之Attention Model（注意力模型）学习笔记

这里还有一个问题：生成目标句子某个单词，比如“汤姆”的时候，你怎么知道AM模型所需要的输入句子单词注意力分配概率分布值呢？就是说“汤姆”对应的概率分布：

转载注明出处：https://www.heiqu.com/zwfxpw.html

[深度概念]·深度学习之Attention Model（注意力模型）学习笔记 (4)

相关推荐