最右边是TI-S,它的特点是全自动、黑科技,不需要用户建模,只需要给它数据,就可以反馈给你一个可用的模型,真正一键建模,模型训练完后能够部署成一个应用。
接下来我们仔细来看一下智能钛产品具体都有哪些功能。在TI-ONE里面支持机器学习、深度学习和模型推理,机器学习里面包含了数据加载、预处理、特征工程、特征选择的工具,后面还有一些具体的算法。深度学习里面包含了一些已经写好的神经网络的算法,针对一些业务的场景也有一些封装好的、针对这个业务场景的算法,例如机器视觉的算法,自然语言处理等等。
在模型推理部分,对于机器学习训练出的模型,后续处理包括模型部署、模型管理、模型监控、模型验证等等。
TI-A相对比较简单,含有一些深度学习的神经网络库和模型推理的功能,UI采用轻量化的客户端,用控制台支持模型和任务的监控。
TI-S的模型训练、部署都是自动化在后台运行,用户只需要把数据传上去,TI-S自动完成数据处理,特征工程,算法选择和参数优化。
智能钛平台降低企业获得AI能力的门槛:框架方面,智能钛平台内置众多主流框架,省去用户自己集成框架的工作;算法方面,由于有内置算法,省去用户很多写算法的工作;模型调优方面,智能钛平台的图形界面可以帮助用户做算法调优,有比较灵活的调度和调参方式;在模型管理方面,智能钛平台可以帮助用户搭建数据闭环,数据闭环只有在自己搭建的算法训练出的模型上才能实现,直接购买的AI应用通常不支持数据闭环;协作方面,智能钛平台支持团队的模型分享、算法分享。
以智能钛为核心,企业还能打造开发者生态,在这个平台上面开发应用,开发者可以省去很多底层比较辛苦的工作,而且能通过这个平台来实现模型的闭环。另外,腾讯有比较强大的技术能力和算法服务,也有比较丰富的数据服务,可以帮助开发者做出更好的AI应用。云平台底层有比较丰富的计算资源,AI开发和运转需要大量计算资源。
这个图是模型自更新的框架图,自建AI模型很难,所以很多企业愿意直接购买AI应用,但当出现以下几种情况的时候,就必须自建模型。第一,如果你需要解决的问题场景比较独特,而不是一个简单的人脸识别、语音识别,例如在很多制造型的企业中,生产流程中需要测量的值比较独特,这种情况下只能自己建模型。第二,数据比较独特,而且你也不愿意把数据公开。建模需要大量数据,例如刚刚讲的AI语音识别中,因为没有方言的语料,就没有很好的方言识别模型。那么如果你需要一个AI模型,而这个模型需要厂商来帮你训练,那你至少得把相应的数据给他。但是有一些你自己公司内部的应用数据,别人买不着,你又不愿意拿出去,这个时候就得自己建模。第三,模型需要不断自更新,自更新在很多场景下都是很重要的,因为模型会衰减,所以需要增加新的数据以适应新的情况,自己建的模型,首先这个数据是自己的,通过一个标注平台进入训练平台,平台都在你自己的机房里面,这边的模型全部都是在平台计算出来的。通过平台和业务系统数据总线打通以后,实际上可以形成一个模型的闭环和数据的闭环,就满足一个模型自更新的要求。
关于平台的应用案例:我们这个平台目前的案例包括:金融领域的风控,营销以及基于NLP、OCR实现运营优化等等;教育领域和高校或赛事举办方合作,以平台为基础来提供比赛的环境以及教学环节等等;商业领域方面,帮物业公司实现物业管理的服务水平优化;工业领域方面,帮地铁公司对轨道、车辆设备做异常检测。以上这些场景大多比较特殊,只能通过机器学习平台自己训练这样的模型。
Q&A
Q1:腾讯的AI定义是什么?从最早的AI识别,到大数据系统,建模放在AI当中,现在更多的是讲深度学习和机器学习,我不太清楚。
A1:语音包括小微都属于AI应用层面,AI应用底下靠什么来承载,就是AI的平台和框架,以及再往下的计算资源。我们这个平台定位的是AI基础平台,它就是一个建模的工具,可以提供的是机器学习和深度学习的建模所需要的工具。
Q2:机器学习在原理上没有变化?用matlab能不能训练机器学习和深度学习模型?