比如可以通过手机APP调用任务机器人去查询后台系统中网络占用的一个时序图,把这个图以报表的方式返回到前端。使用机器人可以有效降低信息过载问题,调用相关接口,直接找到目前最重要的问题并返回。当发现系统出现故障时,可以通过机器人发送命令,重启服务解除故障。
五、总结基于AI中台的思想和实践。智能聊天机器人采用平台化建设方式,使得机器人可以快速复制。第一个机器人从研发到上线用时6个月,接下来是5个月上线,4个月上线,2个月上线,6周上线,最新的项目是3周完成上线。
支持多业务线、系统无缝对接,同时响应个性化需求。产品从立项以来支持公司普惠金融、财富管理的诸多重要业务方,支持PC端、APP端、restful api接口对接。
覆盖同事广,服务时间长。支持一线同事数万人,累积回答问题数十万次以上,累积会话时长近千小时。
运营效果好,节省人力。据统计,有效回答(机器人回答占总回答比例)在80%以上,错误反馈率在5%以下(反馈无用的比例)。
产品种类全。包括问答机器人、闲聊机器人、任务机器人、知识图谱机器人、以及基于场景的交互式机器人(如产品推荐、问卷调查、催收销售等)。
提供工程、算法和运营统一的一站式智能聊天解决方案。比如在线查看标注会话和知识更新、自动化语料导出和模型更新、数据、算法和运营形成闭环。
六、Q & AQ1:语音外呼机器人如何用数据驱动做话术质量评估?比如:要定位哪些话术节点高频发生客户无回应、打断或投诉等,但机器人语音播报里是含多个变量参数的,而且文本会话存储是按ASR识别音转文的,和配置机器人时的固定话术格式不一样,这样一来导致句子量级非常庞大,这种如何统计呢?
A:语音外呼机器人其实是一个统称,一般来说会具体到一个领域,并且和特定场景相结合。比如:电销促销机器人、售后快递送货机器人、语音催收机器人等。
以售后快递送货机器人为例,机器人通过语音电话通知客户,将快递送到家或者指定快递柜等。
在这种特定场景里,主要是要进行话术编排,费时间的也是在话术编排上,需要充分结合业务场景特点,由机器人向客户发问,对客户可能回答的方式进行归类(与具体业务方一起根据现有人工话术可能的回答进行分类)和统计,这样就方便对无回应、投诉等话术进行评估了。
最终用户的回答都会被引导到有限的话术逻辑中,从而达到电话外呼的目的。句子量级庞大,但话术是有限的,不会特别巨大(我们目前场景中的话术都是和业务方一起合作总结的)。
另外,这种场景机器人的配置页面与分享中提到的任务机器人还不完全一样,有其单独的话术编排配置。
Q2:老师提到使用similarity的chatbot,请问这样的chatbot只是做intent识别吗,对于slots的填充是怎样处理的呢?
A:基于相似度的模型用于问答和闲聊机器人。任务机器人的处理基于专门的意图识别模型和实体识别模型来做。
意图识别模型,由于我们要做的是通用化、自助化、弹性化,所以设计了一个轻量级的自训练意图识别框架,基于用户提出的少量语料,通过句子成分分析提取特征,并对特征进行分析而成,其中主要涉及到语言学知识,少量统计学习方法,优点是自训练需求算力很少、解释性强、准确率高、用户完全可以随意添加各类新的任务。
槽值提取基于NER和意图识别中的句子成分分析开展。NER自带通用的时间、地点、人名、组织等实体识别,通用实体由于语料充足,其识别利用了ML、DNN等模型。此外考虑到专业领域里的专有槽值实体(例如合同号、公司内部部门名称、员工编号等等),我们允许用户自行配置列表实体、正则实体等。
Q3:第二种使用模型对intent和slots识别,请问里面的slots识别是character-level的还是word-level的?如果是word-level的,怎样处理cut-word不准带来的问题?
A:槽值中通用实体的识别基于word-level,专有的实体识别比较复杂,常见的情景中如果是列表实体,那么我们在分词阶段已经将列表实体名称加入分词表;正则实体直接做正则匹配。
之所以采用这种NER方式,主要就是降低用户每次新建任务、实体后模型框架自训练的开销,使其可以迅速动态加载新的意图识别和槽值提取task。
Q4:第一个机器人从开发到上线用了六个月,机器人平台开发用了多久呢?