揭秘任务型对话机器人（上篇）

日期：2021-06-13 栏目：程序人生浏览：次

任务型机器人指特定条件下提供信息或服务的机器人。通常情况下是为了满足带有明确目的的用户，例如查流量，查话费，订餐，订票，咨询等任务型场景。由于用户的需求较为复杂，通常情况下需分多轮互动，用户也可能在对话过程中不断修改与完善自己的需求，任务型机器人需要通过询问、澄清和确认来帮助用户明确目的。

2. 任务型机器人的组成

任务型机器人核心模块主要包括三部分：

自然语言理解模块 —— Language Understanding

对话管理模块 —— Dialog Management

自然语言生成模块 —— Natural Language Generation

整体框架如下：

下面根据各个模块进行详细介绍：

2.1 自然语言理解模块

2.1.1 简介

当用户语言经过自然语言理解模块时，即需要经过领域识别，用户意图识别以及槽位提取三个子模块。领域识别，即识别该语句是不是属于这个任务场景，一般有多个机器人集成时，如闲聊机器人，问答机器人等，领域识别应当在进入任务型机器人之前做判断与分发；意图识别，即识别用户意图，细分该任务型场景下的子场景；实体识别与槽位填充，用于对话管理模块的输入。

2.1.2 举例

对这个模块举个简单的例子：假设Text=“人民币对美元的汇率是多少”；经过自然语言理解模块会解析为 act ( slot1 = value1, slot2 = value2 ......) 的形式，即意图，槽位，槽位信息三元组形式，即 Text会解析为“查询（槽位1=人民币，槽位2=美元)"这样的形式。

2.1.3 自然语言理解模块的相关研究工作

意图理解与槽位提取作为任务型机器人的核心模块之一，引起研究者的广泛兴趣。有以下方法：

1. 基于规则理解方法

例如商业对话系统VoiceXML和Phoenix Parser (Ward et al., 1994; Seneff et al., 1992; Dowding et al., 1993)。Phoenix Parser 将输入的一句文本（词序列）映射到由多个语义槽（Slot）组成的语义框架里，一个语义槽的匹配规则由多个槽值类型与连接词构成的，可以表示一段完整的信息，如图2所示。优点:不需要大量训练数据。缺点：1. 规则开发易出错。2. 调整规则需要多轮的迭代。 3. 规则冲突，较难维护。

Phoenix基于TownInfo语料的测试结果见表1：

2. 规则与统计结合的方法

例如组合范畴语法 (CCG)，可以基于标注数据，对大量的复杂语言现象进行统计建模和规则自动提取。由于语法规则的宽松性以及与统计信息的结合，该方法在口语语义理解中的应用可以学习解析无规则的文本 (Zettlemoyer et al., 2007)。基于ATIS语料的测试结果见表2：

3. 统计方法（对齐）

基于词对齐数据的口语理解通常被看做一个序列标注问题。基于生成模型有随机有限状态机 (FST)，统计机器翻译(SMT)、动态贝叶斯网络 (DBN)等，判别模型主要CRF，SVM,MEMM等*(Hahn et al., 2011)。*基于Media evaluation预料测试结果见表3。

4. 统计方法（非对齐）

如生成式的动态贝叶斯网络 (DBN) *(Schwartz et al., 1996)* ，缺点：马尔科夫假设使得该模型不能准确地对词的长程相关性进行建模；分层隐状态的方法能解决上述长程相关性的问题，但所需要的计算复杂度很高 *(He et al., 2006)；支持向量机分类器的基础上提出了语义元组分类器 *(Mairesse et al., 2009) 的方法。基于TownInfo，ATIS语料测试结果见表4。

5. 深度学习方法

单向RNN应用于语义槽填充任务，在ATIS评测集合上取得了显著性超越CRF模型的效果 (Yao et al., 2013; Mesnil et al., 2013)； LSTM等一些扩展（BiLSTM+CRF)；CNN用于序列标注 (Xu et al. 2013; Vu 2016) ;基于序列到序列（sequence-to-sequence）的编码-解码（encoder-decoder）模型，attention等拓展 (Zhu et al., 2016; Liu et al., 2016); 加入外部记忆单元（External Memory）的循环神经网络可以提升网络的记忆能力 (Peng et al., 2015)；RecNN (Guo et al., 2014)等。上述方法测试结果见表5。

6. 基于上述方法的例子

基于规则的解析：如将"我想查询一下美元现在的汇率"输入基于规则的解析器，可以解析出如下意图与槽位的信息。

基于LSTM的模型：句子的标注格式如下，采用BIO标注，以及对整个句子所属的意图标注，采用极大化槽位与意图的似然来求解模型参数。

基于统计方法的模型（SVM）：对句子进行n-gram特征提取，通过训练领域的SVM与槽位的SVM进行分类。

2.2 对话管理模块

2.2.1 简介

转载注明出处：https://www.heiqu.com/zyywyp.html

揭秘任务型对话机器人（上篇）

相关推荐