华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍” (2)

训练深度学习模型需要大量计算,训练收敛时间较长。二阶优化方法可以有效加速模型收敛,减少迭代次数,但同时会引入大量复杂计算,限制了其在深度模型训练中的广泛应用。因此对于计算框架而言,如何高效求解二阶矩阵是一个技术难点。MindSpore的应对方法是矩阵求逆,只考虑对角线上的元素块和每一层内的影响。同时框架不会做全量二阶,会将一阶与二阶优化交替进行,基于动态结果决定二阶计算量。基于这些优化,MindSpore将端到端的训练时间节省了20%。

算子融合是AI框架常见的优化方法。现代计算机硬件架构采用多级内存体系,数据运算时需要逐级输入输出。算子融合就是将相邻算子的计算逻辑合并,节约逐级输入输出的次数,从而提升时间效率。MindSpore还引入了图算融合。最终获得了15%的端到端性能提升。

华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”

在硬件层,MindSpore原生支持高性能的昇腾AI芯片,并针对昇腾的技术特性做了软硬结合优化。在多种优化措施的共同作用下,MindSpore+昇腾芯片的方案比基于V100的方案提升了70%-80%的性能,并在5月份取得了行业AI算力榜第一的成绩。

在部署态,为了将AI模型部署到端侧以实现端云协同,MindSpore提供了轻量化的MindSpore Lite版本。Lite版本与云端完整版使用了统一的MindIR,但在端侧上充分考虑到端侧硬件做了针对性优化。这些优化包括一些算子替换(用一些轻量化的运算代替一些重型运算),还会做一些算子前移后移,避免冗余计算。对于单个算子而言,则会设法希望提升其在端侧CPU上的运行效率。

华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”

这些措施结合取得了很好的性能表现。在华为P40手机上,MindSpore Lite的大多数性能指标都超过了TF Lite。

如今,MindSpore开源社区生态快速发展,在国内开发者群体中发挥着越来大的影响力。MindSpore已于今年开源,代码托管在码云平台。目前MindSpore已发布1.0商用版本,月底即将推出1.1版本。新版将支持40多个通用模型,上线270多个应用。MindSpore社区还有很多兴趣小组来交流各类议题,也欢迎新成员持续加入。

华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”

ModelArts:全流程加快AI应用开发和部署

有了AI计算框架,下一步就需要一套端到端的AI开发平台来实现AI应用的快速落地。华为云ModelArts架构师白小龙博士就此分享了华为云ModelArts一站式AI开发平台及关键技术,应用案例。

AI开发的核心流程主要包括了前期准备(方案设计)、数据准备、算法选择与开发、模型训练、模型评估与调优、应用生成/评估与发布、应用维护子流程。各个子流程都涉及很多复杂工作,存在成本、门槛、效率和可信等多方面的挑战。

华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”

由于目前AI开发者的数量远少于软件开发者的数量,如何让更多人以低门槛的方式上手AI开发、落地AI应用就成为了一个核心问题。在所有子流程中,华为云ModelArts通过提供大量的预置算法和框架,以及WorkFlow编排能力,最大化地降低了AI应用开发的门槛,从而加速了AI应用开发和部署全流程。华为云ModelArts整个平台分为基础平台和上层的预置套件两大部分,对上通过ModelArts Pro使端到端行业应用AI开发更简单。其中,基础平台覆盖AI开发、部署和交易过程需要的各项能力,预置套件则主要针对具体的应用场景提供具备一定泛化能力的沉浸式AI工程与WorkFlow模板,包括面向智能感知的视觉相关的WorkFlow、面向智能认知的NLP相关的WorkFlow、面向决策智能相关的WorkFlow等。以计算机视觉领域的目标检测任务为例,用户无需AI领域知识,只需简单几个步骤(上传数据、标注数据、训练、测试)即可完成一个AI应用开发,以低代码甚至零代码的方式大幅降低AI应用开发门槛。

当开发者需要深入到AI应用开发的各个子流程时,ModelArts提供了多项关键技术来帮助降本增效,并且降低门槛。

1)数据准备子流程

智能化数据增强:可根据跨域迁移自动生成新的可训练数据,从而减少了数据采集和数据标注的工作量。

智能数据筛选,自动化过滤约40%的脏数据。以停车位识别为例,平台可以自动筛除遮挡、过曝、过暗等图像,节省后续开发成本。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wspgwf.html