郭律: 论机器学习平台与人工智能的关系 (2)

日期：2022-10-05 栏目：程序人生浏览：次

在健康领域，海量数据包括患者的行为数据、处方数据、病史数据等等，用这些数据做疾病预测，例如糖尿病预测，根据病人的数据预测两年或三年以后得糖尿病的概率，就是AI的一个应用场景。

最后一个场景AI加制造，在很多工厂里面也需要，用AI改善工艺流程或者降低成本，在这里海量数据会包含机台参数（每一个不同的设备加工时的输出参数）、工艺流程数据，场景包括通过机器学习做一些智能测量以解决在某些人到不了的情况下需要做检测的问题。

在不同的业务场景里面，AI数据和AI业务问题具有多样性。但是相对而言AI人才（包括建模和工程人才）和AI的计算资源和计算能力是通用的，各场景的建模过程大体上也差不多。

同时AI人才和计算能力又是有层次的，AI从理论研究到能够应用到工程中需要经历4个层面，最贴近业务的一层是模型，然后是算法，业务问题提出后在算法层面调试获得模型，模型不不能直接使用，如何打造数据闭环，需要在工程层面或者产品层面去实现。至于计算框架和计算资源层，模型训练还有很多工程方面的问题需要解决，包括算法与数据源集成、训练的日志和错误监控、任务调度等等。这些问题和业务相关度较小，但技术难度又很大，实施周期长，给传统企业使用AI、拥有AI能力造成了一定的困难。

我们把AI的人才按照成熟度的不同分成4类：第一种是AI Geek，从底层计算资源搭建到计算框架的引入，一直到上面的算法编写，包括模型的调优，一个人可以做完，这种人非常的稀缺，效率不一定高，因为所有工作都要重头做。

第二种是AI研究者，他们对某类算法很熟，他们自己会写比较高级的算法。但是他们可能对底层的计算框架，比如说GPU怎么管理，不是很清楚，只要把算法写好就可以了，底层交给工程人员，这属于AI的研究者。

第三种是AI的从业者，在座的同学大部分在这个层级上面，这一块的特点是：知道整个建模的流程；也能够用一些开源的算法做模型训练，希望能够有一个比较好的机器学习UI，不需要从框架上或者每一个交互都需要一个命令行来建模。

最后一种是AI的应用人员，希望直接拿到发挥作用的模型，不关心模型的原理，希望的是能够从业务数据直接获取一个模型来解决业务问题。

根据以上这么多用户层次的差异性，我们需要针对不同用户诉求提供差异化的方案、产品和服务。

先从最底层说起，针对AI研究人员需要提供计算资源、任务的调度、计算资源的管理，他自己写算法。

第二类是AI从业者，AI从业者需要自己建模，对算法做少量改动。另外他们关心模型建好以后，如何与业务系统集成，数据闭环如何实现。数据闭环是为了防止模型衰减，保证模型上线后能够迭代训练以保持效果，这也是这个层级的用户会关心的事情。

再往上一个层级就是AI应用者，AI应用者需要模型自动训练、自动数据分析、自动特征工程，模型训练完成后自动布署为服务。***还能够对模型微调，就是加一些数据，可以适应新的场景。

我们针对不同层次的客户提供差异化的产品，最左边的TI-A是深度学习加速器，主要是做模型训练加速，我们的速度很快，在云上面使用TI-A平台，可以帮助用户实现深度学习训练的加速。而且这个模型训练完以后，它可以一键部署，这也解决了模型训练完以后怎样可以应用到业务场景里，怎样做预测的问题。

中间的产品TI-ONE，是智能钛一站式机器学习平台，它有一个可视化的UI，用户可以一目了然看到整个建模的工作流，可以看到数据的流转关系和各环节的依赖关系，这个产品可以让用户方便地建模，而且里面有很多内置的算法。

转载注明出处：https://www.heiqu.com/zgdpwf.html

郭律: 论机器学习平台与人工智能的关系 (2)

相关推荐