记者:最后一个问题我们来聊聊AI的应用前景吧。您觉得现在AI技术是否已经成熟到可以大规模落地应用了?以金融行业举例的话,您认为要真正实现AI技术在金融服务中的全面落地,现在还缺少什么?比如技术方面、数据资源方面等。
王东:最近对AI应用讨论得挺多,有以下几种观点:
“速胜论”:理由是基于深度学习技术的爆发式进步,由AlphaGo完胜人类职业围棋顶尖水平为导火索,在图像领域(图像识别、人脸识别、视频识别等)、语音领域(语言识别、语言合成、智能翻译等)取得了巨大的成功,火热的人工智能带来了很多机会,资本的大量涌入,市场上涌现了一大批 AI 初创公司,同时媒体的大肆宣扬,比如说「人类要被机器人取代」「机器开始威胁人类」等等,导致一部分人对AI技术已经能够大规模普及和落地充满信心。
“投降主义论”:随着进一步研究发现,许多问题并没有解决。例如开放领域的聊天机器人不够聪明,整体有待加强。主要原因在于自然语言理解的发展进程并没有我们想象中快,深度学习也似乎没有解决这个问题,可以与人类对话交流的机器人好像从未出现过。有外媒甚至评论道:“我不确定能不能说聊天机器人死了,因为我不知道它是否活过。”除了上述的一些成功领域,深度学习也并没有解决其他所有领域的问题。
了解到人工智能历史的同行都知道,其实人工智能至今经历了三次大的热潮。每次都经历了开始是“人类要毁灭了”,后来是“骗子”的过程。
实际上,在一个特定领域的优秀表现,并不能代表 AI 技术无所不能。同样的,在通用领域不能解决的问题,不代表特定领域不能解决。
我更加相信“持久战论”,罗马从来都不是一天能够建成的,技术的突破也必然会经历一定时间的积累。AI技术在金融服务中的落地,我比较赞同宜信CTO向江旭先生提的观点“大胆拥抱,小心实践”。
首先需要选择金融领域的业务痛点,并通过AI技术来解决这些痛点,把非常炫酷的AI技术落实到实际业务需求中,而不是为炫酷而炫酷。就目前而言,我们的AI中台会选择在智能机器人和知识图谱构建上发力。智能聊天机器人能为公司内外提供专业领域的知识解答,知识图谱能为各业务方提供智能问答、智能搜索、精准营销等。最重要的是,我们希望按照平台化的方式去建设它们,希望建设知识图谱的方法论、工具和平台可复用。
目前在落地过程中,除了搭建AI中台相关平台以外,花费时间最多的是与数据相关的过程,无论是模型训练,还是知识图谱构建,很多时间用在获取数据和探索数据。
对于普通的模型训练,需要多个维度的数据,AI科学家需要对这些数据进行观察和探索,一般这些数据都是结构化数据,这个问题会随着数据中台的成长,数据汇集越来越多后,得到逐步的解决。数据中台提供自助化探索数据的能力,能够大幅减少获取数据和探索数据的时间和成本。
对于图谱构建和自然语言处理,我们很多的金融数据保存为非结构化的数据和语料,例如pdf文档、表格数据、扫描图片等,一方面要求数据中台或数据平台能够提供非结构化数据的获取能力,另一方面也要求AI中台提供对这种非结构化数据进行在线标注、在线提取的平台级能力。
嘉宾介绍
王东:宜信科技中心AI中台团队负责人
北京大学软件工程专业硕士,宜信科技中心AI中台团队负责人,目前负责宜信AI中台平台的建设工作。研究领域方向包括开放AI平台建设、智能聊天机器人、实时数据归集和处理、大数据平台研发和推广等。拥有10年以上金融和互联网企业基础系统和数据类研发经验。宜信敏捷大数据栈DBus开源项目负责人,CUBRID-cluster开源项目发起人。曾任韩国最大搜索引擎公司——Naver资深工程师,多年负责CUBRID-cluster分布式数据库引擎和CUBRID数据库引擎研发工作。