摘要:MindSpore 很多新个性与大家见面了,无论是在效率晋升、易用性,还是翻新方面,都是干货满满。
本文分享自华为云社区《MindSpore 开源一年的新个性介绍》,原文作者:简略保持。
最近,AI 计算框架是业界的热点,各大厂商纷纷投身 AI 框架的自研发,究其原因:AI 框架在整个人工智能计划里,就像计算机的 OS 一样,得 AI 框架者得天下,得什么呢?生态!
上面咱们来介绍下 MindSpore 开源一周年后,有哪些牛 B 的个性公布。(MindSpore 已集成到华为云全流程 AI 开发平台 ModelArts 里,开发者能够十分不便的在华为云 ModelArts 里体验 MindSpore 新个性)。
1、大幅晋升动态图下分布式训练的效率:
在深度学习中,当数据集和参数量的规模越来越大,训练所需的工夫和硬件资源会随之减少,最初会变成制约训练的瓶颈。分布式并行训练,能够升高对内存、计算性能等硬件的需要,是进行训练的重要优化伎俩。以后 MindSpore 动态图模式 曾经反对数据并行,通过对数据按 batch 维度进行切分,将数据调配到各个计算单元中进行模型训练,从而 缩短训练工夫。
基于 ResNet50 v1.5+ImageNet 数据集测试,昇腾算力,MindSpore 动态图模式分布式的体现,能够达到 PyTorch 典型分布式场景的 1.6 倍,动态图模式分布式的体现也能够达到 TensorFlow 典型分布式场景的 2 倍。
PyNative 疾速入门:https://www.mindspore.cn/tuto…
2、数据预处理减速 Dvpp:
数据是机器学习的根底。在网络推理场景中,咱们须要针对不同的数据进行数据的预处理,从中过滤出外围信息放入咱们训练好的模型中进行推理预测。在理论利用场景中,咱们往往须要对大量的原始数据进行推理,比方实时的视频流等。因而,咱们在昇腾推理平台引入了 Dvpp 模块,来针对网络推理数据预处理流程进行减速。
Dvpp 数据预处理模块提供 C++ 接口,提供图片的解码、缩放,核心抠图、标准化等性能。在 Dvpp 模块的设计中,思考到整体的易用性,其性能与 MindData 现有 CPU 算子有重叠,咱们将其 API 对立,通过推理执行接口设置运行设施来进行辨别。用户能够依据本身硬件设施环境来抉择最佳的执行算子。Dvpp 数据预处理流程如下图所示:
咱们在一台昇腾推理服务器上测试了 Dvpp 系列算子的性能收益。该服务器领有 128 个主频为 2.6GHz 的 CPU 外围,以及 128Gb 的内存空间。在试验中,咱们选取 yoloV3 网络,同时选取 coco2017 推理数据集 40504 张图片进行推理,最终失去模型输出尺寸为 [416, 416] 的图片。
咱们别离应用 Dvpp 算子和 CPU 算子进行数据预处理,失去如下性能比照:
能够看到 Dvpp 系列算子相较于 CPU 算子在解决大量数据时性能劣势显著,在本试验中解决 40504 张图片性能 FPS 晋升 129%。
查看教程:https://www.mindspore.cn/tuto…
3、分子模仿库(SPONGE),来自社区分子动力学工作组:
MindSpore 版的 SPONGE 是在社区中的分子动力学工作组 (MM WG) 中,由北大、深圳湾实验室高毅勤课题组与华为 MindSpore 团队联合开发的分子模仿库,具备高性能、模块化等个性。
为何须要开发 SPONGE?
分子动力学模仿是用牛顿定律近似来形容宏观原子和分子尺度演变的计算机模仿办法。其既可用于基础科学钻研也可用于工业理论利用。在基础科学畛域,分子动力学办法有助于科研学者从宏观钻研体系的物理化学性质。
在工业生产中,其能够利用大规模计算的能力辅助药物分子的设计和蛋白靶点的搜查 [1,2]。因为模仿的工夫和空间尺度限度,传统分子动力学软件的利用范畴受到较大限度。科研工作者也在一直的开发新的力场模型[3,4]、抽样办法[5,6] 以及尝试联合新兴的人工智能 [7,8] 来进一步拓展分子动力学模仿的实用畛域。
由此,新一代的分子动力学软件就须要被提上日程。其应该具备模块化的个性,可能反对科学家高效的发明和搭建出可能验证其实践模型的构造。同时,它还须要兼顾传统模仿办法的高效性,可能兼容其在传统畛域上的应用。此外,为实现分子模仿 + 机器学习的天然交融,其还应该领有嵌入人工智能框架的状态。SPONGE 就是基于这些理念而被发明出的全新的,齐全自主的分子模仿软件。
相比于之前在传统分子模仿软件上联合 SITS 办法进行生物分子加强抽样[9],SPONGE 原生反对 SITS 并对计算流程进行优化使得其应用 SITS 办法模仿生物体系更加高效。针对极化体系,传统分子模仿采纳联合量化计算等形式来解决电荷浮动等问题[10]。即便采纳机器学习升高计算量也会节约大量工夫在程序数据传送的问题上。而 SPONGE 利用模块化的特点可反对内存上间接与机器学习程序通信大大降低了整体计算工夫。
图 1:联合 SITS 等办法可进行 Na[CpG], Lys 生物分子模仿
图 2:机器学习 + 分子模仿办法可更快更精确地模仿极化体系,图为[C1MIm]Cl 离子液体模仿
MindSpore + SPONGE
基于 MindSpore 主动并行、图算交融等个性,SPONGE 可高效地实现传统分子模仿过程。SPONGE 利用 MindSpore 主动微分的个性,能够将神经网络等 AI 办法与传统分子模仿进行联合。
SPONGE 模块化设计结构图
随 MindSpore1.2 版本开源的 SPONGE 具备以下劣势:
1、全模块化分子模仿。模块化构建分子模仿算法,易于畛域研发人员进行实践和算法的疾速实现,并为内部开发人员奉献子模块提供敌对的开源社区环境。
2、传统分子模仿与 MindSpore 联合的人工智能算法的全流程实现。在 MindSpore 中,研发人员能便当的将 AI 办法作用于分子模仿中。全算子化的 SPONGE 将与 MindSpore 进一步联合成为新一代端到端可微的分子模仿软件,实现人工智能与分子模仿的天然交融。
教程文档:https://www.mindspore.cn/tuto…
MindSpore+SPONGE 瞻望
近期瞻望:在后续的版本更新中会陆续退出曾经实践验证好的 MetaITS 模块、有限元计算模块等性能。这些模块将帮忙 SPONGE 能更好的从事相变和金属表面相干的模仿。同时,MindSpore 版 SPONGE 各模块逐渐反对主动微分和主动并行,对于连接机器学习计划提供更敌对的反对。
远期瞻望:拓展 SPONGE 的各种特色模块,使其可能形容大部分宏观体系并同时具备较高的计算和采样效率。对特定工业需要,如药物筛选或晶型预测,将基于 SPONGE 衍生出残缺的流程化计算计划,可能满足大规模并行计算的需要。在 MindSpore 框架下,SPONGE 具备元优化性能,从而实现更精确和更快的力场拟合。
4、量子机器学习(MindQuantum),来自社区量子力学工作组:
MindQuantum 是联合 MindSpore 和 HiQ 开发的量子机器学习框架,反对多种量子神经网络的训练和推理。得益于华为 HiQ 团队的量子计算模拟器和 MindSpore 高性能主动微分能力,MindQuantum 可能高效解决量子机器学习、量子化学模仿和量子优化等问题,性能达到业界 TOP1(Benchmark),为宽广的科研人员、老师和学生提供了疾速设计和验证量子机器学习算法的高效平台。
MindQuantum vs TF Quantum/Paddle Quantum 性能比照
查看教程:https://www.mindspore.cn/tuto…
5、多跳常识推理问答(TPRR):
TPRR 是解决凋谢域多跳问题的通用模型。相比于传统问答仅需从单个文档中检索答案,多跳常识推理问答须要从多个佐证文档失去最终答案,并返回问题到答案的推理链。TPRR 基于 MindSpore 混合精度个性,能够高效地实现多跳问答推理过程。
全门路建模:
TPRR 模型在多跳问题推理链的每一个环节中基于全副推理门路的条件概率建模,模型以「全局视角」进行常识推理。
动静样本选取:
TPRR 模型采纳动静样本的建模形式,通过更强的比照学习晋升模型多跳问答的能力。
算法流程图如下:
TPRR 模型在国内权威的多跳问答榜单 HotpotQA 评测中荣登榜首,榜单图如下:
查看教程:https://www.mindspore.cn/tuto…
6、一键模型迁徙(MindConverter):
脚本迁徙工具(MindConverter)旨在帮忙算法工程师将存量的基于三方框架开发的模型疾速迁徙至 MindSpore 生态。依据用户提供的 TensorFlow PB 或 ONNX 模型文件,工具通过对模型的计算图(Computational Graph)解析,生成一份具备可读性的 MindSpore Python 模型定义脚本(.py)以及相应的模型权重(.ckpt)。
一键迁徙:
通过 MindConverter CLI 命令即可一键将模型迁徙为 MindSpore 下模型定义脚本以及相应权重文件,省去模型重训以及模型定义脚本开发工夫;
100% 迁移率:
在 MindConverter 具备跨框架间算子映射的状况下,迁徙后脚本可间接用于推理,实现 100% 迁移率;
反对模型列表:
目前工具已反对计算机视觉畛域典型模型、自然语言解决 BERT 预训练模型脚本及权重的迁徙,具体模型列表见 README。
BERT 模型定义迁徙后果展现(局部代码):
查看教程:https://www.mindspore.cn/tuto…
7、鲁棒性评测工具助力 OCR 服务达成首个 AI C4 鲁棒性规范要求:
MindSpore 鲁棒性测试工具 MindArmour,基于黑白盒反抗样本(20 + 办法)、天然扰动(10 + 办法)等技术提供高效的鲁棒性评测计划,帮忙客户评估模型的鲁棒性性,辨认模型软弱点。
OCR 是指利用光学设备去捕捉图像并辨认文字,缩小人工成本,疾速晋升工作效率;如果攻击者通过看待辨认的文字做出人眼不易觉察的批改,而模型无奈对其正确辨认或解决,就会导致 OCR 服务对文字辨认的准确率降落,且应用人员不分明问题背地的起因。测评团队应用 MindArmour 对 OCR 服务的鲁棒性进行测评,发现 OCR 服务中局部模型对天然扰动和反抗样本的防御能力较差,如文本框检测模型在校验噪声、PGD、PSO(粒子群)等攻打算法下准确率小于 66%;并以此领导模型开发团队通过反抗样本检测、数据加强训练等技术,使得模型对歹意样本的辨认准确率达到 95+%,进步了模型及 OCR 服务的鲁棒性。
AI C4 规范链接:https://www.bsi.bund.de/Share…
点击关注,第一工夫理解华为云陈腐技术~