关于人工智能:ICML-2021顶会来袭百度飞桨AI硬实力集中展现

往年的 ICML（机器学习国内会议）要来了！

北京工夫 7 月 19 日，由百度主办的 ICML 2021 Expo 也将正式召开，这也是本次由国内企业申请主办的惟一一个 Expo。

在本次 Expo 上，来自百度的科研人员将介绍百度基于飞桨在计算机视觉、自然语言解决、语音、量子计算等多个技术畛域的最新进展和产业实际积攒，蕴含十个主题演讲。

百度飞桨亮相 ICML 展示多面 AI 技术实力

ICML（机器学习国内会议）作为国内机器学习学会（IMLS）主办的年度机器学习国内顶级会议，是国内机器学习畛域探讨前沿科技成果和技术实际利用的重要舞台。

此次百度举办的 Expo 将从多个角度、全面展现飞桨在深度学习畛域弱小的技术劣势和深厚的产业实际积攒。

飞桨（PaddlePaddle）作为我国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台，目前曾经凝聚了 320 万开发者、服务企事业单位 12 万家，涵盖工业、能源、金融、医疗、农业、城市治理等多个畛域。

不久前，飞桨开源框架正式降级到 2.1 版本，对主动混合精度、动态图、高层 API 等进行了优化，在模型套件方面文心 ERNIE 全新开源公布四大预训练模型，部署和硬件生态方面也继续拓展。

十大主题演讲干货十足期待碰撞技术火花

技术的倒退离不开研究者潜心钻研，更须要互相交换碰撞灵感火花。本次百度举办的 ICML 2021 Expo 蕴含十个主题演讲，期待与寰球 AI 顶尖人才开展宽泛交换与学习，分享和探讨百度飞桨最新技术成绩与利用心得。

以下为主题演讲介绍：

PaddleCV: Rich and Practical CV Models from Industrial Practice

主题一：

PaddleCV：工业实际中丰盛实用的 CV 模型

为了满足企业低成本开发和疾速集成的需要，飞桨重点建设了大规模的官网模型库，蕴含通过产业实际长期打磨的支流模型以及在国内比赛中的夺冠模型。百度资深算法工程师将为大家带来飞桨视觉模型库 PaddleCV 的技术分享。

PaddleCV 作为飞桨重点研发的视觉模型库，为开发者提供了面向图像分类（PaddleClas）、指标检测（PaddleDetection）、图像宰割（PaddleSeg）、文本辨认（PaddleOCR）、图像生成（PaddleGAN）等视觉场景的多种端到端开发套件和海量视觉方向模型，其中 PaddleOCR 和 PaddleDetection 开发套件更是被泛滥企业宽泛应用。飞桨开发套件围绕企业理论研发流程量身打造，服务企业遍布能源、金融、工业、农业等泛滥畛域。

GP-NAS: Gaussian Process based Neural Architecture Search

主题二：

GP-NAS: 基于高斯过程的模型构造主动搜寻技术

通过对深度神经网络进行模型构造主动搜寻，NAS（Neural Architecture Search）在各类计算机视觉的工作中都超过了人工设计模型构造的性能。GP-NAS 旨在解决 NAS 中的三个重要问题：如何掂量模型构造与其性能之间的相关性？如何评估不同模型构造之间的相关性？如何用大量样本学习这些相关性？

为此，GP-NAS 首先从贝叶斯视角来对这些相关性进行建模。通过引入一种基于高斯过程的 NAS 新办法，并通过定制化的核函数和均值函数对相关性进行建模。并且，均值函数和核函数都能够在线学习，以实现针对不同搜寻空间中的简单相关性的自适应建模。

此外，通过联合基于互信息的采样办法，能够通过起码的采样次数就能预计 / 学习出 GP-NAS 的均值函数和核函数。在学习失去均值函数和核函数之后，GP-NAS 就能够预测出不同场景，不同平台下任意模型构造的性能，并且从实践上失去这些性能的置信度。

GP-NAS 不仅在 CIFAR10 和 ImageNet 等分类工作上获得了 SOTA 的试验后果，在人脸识别工作上同样获得了十分好的后果。本次分享还会介绍搜寻空间的设计以及超网络的一致性问题，并介绍 GP-NAS 屡次在国内较量中夺冠的经验。

Multimodal-based 3D Object Detection

主题三：

基于多模态的三维指标检测

精准的预计四周物体的三维地位对于主动驾驶零碎十分重要。为了确保主动驾驶零碎的安全性，无人驾驶汽车通常利用多种传感器（如相机、Lidar 等）来感知四周的环境，在此次演讲中，百度别离介绍了基于不同传感器的三维物体检测算法。

首先介绍了利用 CAD 模型和 CAD 模型 free 的两种不同的基于单帧图像的三维物体地位预计算法。相机老本低廉，能够提供具体的纹理与色彩信息，试验表明对于间隔较近的物体检测成果显著。

相比基于相机的预计算法，基于 Lidar 的三维物体检测算法效果显著晋升。对于如何晋升罕见类别的检测成果，始终是一个凋谢的钻研问题。随后介绍了一种简略无效的基于 Rendering 的三维物体加强策略，能无效地思考不同前景物体之间、以及前景与背景物体之间的遮挡关系。在公开数据集上的测试成果表明此算法对于所有类别的检测成果都有晋升，尤其对于罕见类别的检测后果晋升尤为显著。

最初，介绍了一种简略无效的基于 2D/3D 场景宰割的多模型交融框架，同时开掘图像和点云的劣势，能无效地晋升三维物体的检测后果。此前，该算法的升级版在 ICRA2021 nuScenes 三维物体检测公开赛上取得冠军。目前 PaddlePadlle 框架反对通用三维点云了解，蕴含基于点云的三维物体检测、宰割以及基于单帧图像的三维物体地位预计等，未来会开源更多的基于点云的三维深度模型。

PaddleSeg: A High-Efficient Development Toolkit for Image Segmentation

主题四：

高效图像宰割工具——PaddleSeg

语义宰割是十分重要并极具挑战的视觉工作，在人机交互、加强事实和无人驾驶畛域有着重要的利用价值。本次演讲将介绍一个基于飞桨的语义宰割算法平台 PaddleSeg，它提供了许多经典的语义宰割算法（FCN、DeepLab、PSPNet 等）的实现。同时，演讲也会介绍百度最近基于 PaddleSeg 研发的一些新的语义宰割算法。

Interpretable Deep Learning: Interpretation, Interpretability, Trustworthiness, and Beyond

主题五：

可解释的深度学习——解释性、可解释性、可信赖性和超越性

深度学习模型目前曾经在许多畛域——比方计算机视觉、自然语言解决、生物、医疗等达到甚至超过了人类的程度。然而，深度学习模型始终被当做黑盒应用，其决策过程和判断规范始终让人难以了解。

基于目前支流的可解释性算法，在本次演讲中将系统地介绍深度学习模型的可解释性，包含可解释性的重要性、可解释性算法的分类以及如何评测这些算法的可靠性。百度开源了基于飞桨的可解释性算法代码库 InterpretDL，集成了十数种可解释性算法，其中也蕴含了百度对于可解释性的最新钻研工作，并将对其中的两项工作进行具体的介绍。百度的开源库 InterpretDL 全面解耦了算法与模型，并提供详尽的教程，不便易用，同时满足学术界和工业界的需要。

Paddle Graph Learning and Its Applications

主题六：

飞桨图神经网络框架 PGL 及其利用

在本次演讲中，百度将会介绍高效易用的大规模图神经网络框架飞桨 PGL。图神经网络最大的特点是可能建模样本与样本的连贯信息，然而编码样本之间的关系，在原生的深度学习框架中个别都比较复杂。飞桨 PGL 采纳消息传递范式作为图神经网络的编程接口，使得图神经网络的编写变得非常便当；并且针对图神经网络场景做了大量的性能优化，包含提出并行音讯聚合、多卡并行 FullBatch 训练等技术，大大晋升了图神经网络的工业实用性。

本演讲将展现飞桨 PGL 在图神经网络的钻研下面获得的停顿，并且分享具体案例，介绍如何通过万亿规模图引擎以及参数服务器的整合，落地工业级图神经网络应用。

Unified Modal Learning: Motivation, Practice and Beyond

主题七：

对立模式学习——动机、实际与超过

现有的预训练技术关注于离开解决单模态工作或者多模态工作，漠视了应用一个对立的预训练模型同时解决单模、多模问题带来的益处以及对应的挑战。反观人类则十分善于从多源异构数据中联结学习，从而更好地了解物理世界的相干概念。

基于此，百度提出对立模态学习，指标是从大规模图像、文字、图文对等数据中联结学习，并具备同时解决单模态工作和多模态工作的能力。基于飞桨，百度提出了一个对立模态学习框架 UNIMO，并在多个自然语言解决和视觉 - 语言多模态工作上获得了当先问题。百度心愿对立模态学习，可能提供一条通向通用人工智能的可能思路，并且借助社区的力量独特建设。

FedCube: Federated Learning and Data Federation for Collaborative Data Processing

主题八：

FedCube——用于合作数据处理的联邦学习和数据联结

近年来，数据和计算资源通常散布在用户终端、各个地区或组织的设施中。因为法律或法规的限度，分布式数据和计算资源不能在不同地区或组织之间间接聚合或共享，用于数据处理或机器学习工作。联邦学习和数据联邦在恪守法律法规、确保数据安全和数据隐衷的前提下，无效利用分布式数据和计算资源，训练机器学习模型和协同解决数据。

在本次演讲中，百度展现包含 PaddleFL 在内的联邦学习零碎的性能架构，并介绍了基于百度联邦学习零碎的钻研工作。

Generalizing from a Few Examples by PaddleFSL

主题九：

基于飞桨的小样本学习工具库 PaddleFSL

人工智能畛域欣欣向荣，但现有技术通常须要大量标注数据和高算力的高性能计算设施撑持。与之比照，人类却能够利用已学习的常识，疾速从几个示例中学到规定，这使得当初的人工智能间隔“像人”还有较大间隔。小样本学习（FSL）钻研如何疾速泛化到仅蕴含几个标注数据的新工作，是放大人工智能和人类学习之间差距的重要一环。

此外，FSL 使对常见状况的学习成为可能，例如在药物发现中给定一些标记分子来预测新的分子个性。鉴于高质量的标记数据获取老本高，FSL 的利用还有助于升高工业利用中收集大规模监督数据的收集、标注、解决和计算耗费。

在本次演讲中，百度将介绍基于飞桨的 FSL 工具包 PaddleFSL。它蕴含了很多简略易用的 FSL 办法，反对图像分类、关系抽取等常见利用，同时易于扩大到新利用。百度心愿 PaddleFSL 能够助力学术界和工业界的钻研和开发者在各种场景下轻松摸索 FSL。

Paddle Quantum: Towards Quantum Artificial Intelligence

主题十：

量桨——迈向量子人工智能

人工智能是新一轮产业改革的重要驱动，量子计算则是备受瞩目的前沿技术，二者的交融孕育出新的方向：量子人工智能，该演讲则带来了百度在该方向的最新进展。基于深度学习平台飞桨，百度研发了国内首个量子机器学习工具集“量桨”，旨在减速人工智能与量子计算的交融翻新。

近期量桨公布 2.1 版本，运行效率均匀晋升 20%，通过量子神经网络、量子核办法、含噪量子电路等模块，开发者们能够在量桨上便捷地进行人工智能、组合优化、量子化学方面的利用研发。借助深度学习对量子技术的赋能，量桨 LOCCNet 发现了新的纠缠提纯计划，相比业界现有计划获得了更好成果。此外，量桨官网 qml.baidu.com 提供了丰盛教程与案例，助力开发者入门与研发。百度量子平台以量脉、量桨、量易伏为主体，旨在将用户和量子服务紧密结合，赋能教育、科学研究、工业生产等畛域，构建凋谢、可继续的百度量子生态，最终实现“人人皆可量子”的美妙愿景。