从平台层面来说,智能聊天机器人所需要的模型服务是可以向下沉淀的,通用化后成为AI中台的AIHub模型服务平台。 这样聊天机器人平台不必关心模型管理,只需要关注自己聊天机器人领域的事情,例如模型服务、模型编排、模型监控预警等这些模型通用能力的事情交给AI中台的AIHub模型服务平台来解决。实现产品模块边界清晰,并提高复用性和专业度,减少重复建设。
记者:宜信技术学院组织了2次直播分享,主题分别是数据中台和AI中台,您在这两个项目都扮演了重要的角色,现在也越来越多的人提到数据中台需要向AI中台演进,您对此怎么看?宜信的数据中台和AI中台之间是什么样的关系?二者之间是如何支持协作的?
王东:数据中台除了提供数据平台本身的两大能力(数据存储和数据计算)以外,还提供了更高级的能力,就是把数据变成一种基础服务提供给业务方,业务方可以以自助的方式在数据中台上获取数据,进行数据处理、数据探索、数据挖掘、分析钻取、多维分析、自助化报表、数据分享等,以快速的实现自己的商业价值。
随着业务的发展,越来越多的智能化数据需求被提出,这些智能化需求涉及到模型训练、数据标注、特征工程、模型部署、性能监控等,需要使用机器学习、深度学习等算法支持。数据中台的主要目标还是服务数据,对于智能化和模型并不能很好地支持,因此AI中台应运而生。
我们把智能服务的需求抽象出来,形成一个独立的AI中台层。AI中台是一个用来构建智能服务的基础设施平台,对公司所需的模型提供了分布分层的构建能力和全生命周期管理的服务,鼓励各个业务领域基础性、场景性、通用性的AI能力沉淀到平台中,加强模型复用、组合创新、规模化,最终实现降本增效和快速响应业务方。
数据中台和AI中台两者是相互依存,承前启后的关系。
数据中台和AI中台两者都对外提供服务,只是侧重点不同:数据中台提供各种数据服务(BI报表应用、数据探索等),AI中台提供各种智能服务(模型预测、智能推荐等);
AI中台依托数据中台提供的数据能力和工具集,加速AI相关服务的开发和复用,来应对前台智能业务需求。有了数据中台清洗好的数据,搭建智能项目事半功倍;
数据中台也需要使用AI中台的智能化能力使得数据使用更加平民化和智能化。例如增强型BI分析:通用自然语言交互方式,降低BI使用门槛;通过AI分析给出参与建议,帮助普通用户在没有数据专家的情况下有效访问数据;增强型数据管理:利用机器学习来管理数据,包括数据质量、元数据管理;主数据管理等。
记者:从去年开始,似乎每个公司都在谈中台,但其实很多人对中台的具体价值还不是很理解,从宜信的数据中台和AI中台这两个项目来看,中台在赋能业务方面有哪些优势?请您举几个例子具体介绍。
王东:在“以用户为中心”的思想指导下,企业需要快速响应、挖掘、引领⽤户的需求,借助平台化的力量可以事半功倍。后台并不为前台而生,要么不好用,要么变更速度跟不上前台的节奏。就算是新建的后台系统,因为其后台管理的属性(考虑到企业安全、审计、合规、法律等限制)导致不能适应前台快速开发的需求。前台和后台就像是两个不同转速的⻮轮,前台要快速响应,后台则要求越稳定越好。
因此中台应运而生,中台存在的目的就是更好地服务前台,进而更好地响应服务。在宜信,数据中台和AI中台也同样是为了更好更快地服务前台而存在:
以数据中台为例:业务领域组数据团队需要紧急制作一批报表,不希望排期,部分报表需要T+0时效性。数据来源是异构数据库,对数据时效性要求很高,需要对数据处理后并展示报表。使用数据中台,业务方不需要关心数据的异构性,无论是实时数据还是批量数据,只需要懂SQL,业务方都可以在数据中台上申请数据,自助地写SQL进行处理数据清洗、数据处理,最后,通过配置和写SQL生成自己需要报表,不用等排期,完全自助快速完成。
以AI中台为例:AI中台的智能聊天机器人平台,对接第一个业务方是从零开始,从研发平台、模型研发、数据对接、到使用上线第一期,花了6个月的时间,第二个业务方享受到平台的优势,直接导入数据,进行验证和对接后,4个月实现上线第一期,之后的业务方更快2个月上线,最近的一个业务方达到3周就上线的速度,体现了平台的复用性带来的便捷和快速响应业务方需求的能力。