关于人工智能:全球选手逐鹿清华首届AI药物研发算法大赛完美收官

106次阅读

共计 1755 个字符，预计需要花费 5 分钟才能阅读完成。

8 月 26 日，首届寰球 AI 药物研发算法大赛决赛问难暨颁奖典礼，在清华大学生物医学馆举办。来自微软研究院、中国科学院上海药物研究所、上海交通大学等单位的十五支团队，从寰球 878 支团队中怀才不遇，进入了决赛问难环节。

产教交融，共育 AI 药物研发人才

总决赛开幕式上，清华大学药学院副院长陈犯罪代表主办方致开幕辞，并对来自寰球高校、研究院所和企业的嘉宾参赛团队示意热烈的欢送。他示意，长期以来，药物研发面临老本高、成功率低的问题，而 AI 技术的倒退为此带来了新的时机。 清华大学药学院心愿通过较量，促成高校、科研院所与企业在 AI+ 药学畛域的单干与倒退，解决制药畛域的难题，同时可能从大赛中，孕育更多 AI 与生物医药交叉学科的人才。本次大赛的次要内容是预测小分子在细胞程度是否可能克制新冠病毒，是一个分子示意学习的问题，也是药物化学与小分子药物设计中的关键问题！

总决赛评委，别离为中国科学院上海有机化学研究所 丁克传授 、上海交通大学医学院药物化学与生物信息学核心主任 张健传授 、罗氏中国翻新核心 AIDD 负责人 林翼博士 、清华大学药学院 田博学副教授 和百度资深产品设计师，飞桨螺旋桨 PaddleHelix 产品负责人 张肖男女士。

专家评委们对团队的问难进行发问并提出贵重倡议

总决赛团队逐鹿清华，问难现场“神仙打架”

来自微软亚洲研究院的 ViSNet-Drug 团队，利用自主研发的 AI2BMD 动力学模拟系统和预训练的 ViSNet 模型。在初赛中，AI2BMD 对小分子和靶点蛋白 Mpro 的联合自在能进行准确计算并对数据进行 pseudo label 标注。AI2BMDk 可对超过 10,000 原子的蛋白质模仿，达到靠近密度泛函实践（DFT）的精度的能量计算并缩短了数个数量级的计算工夫。在复赛中，团队利用 AIMD-Chig 数据集对 ViSNet 模型进行预训练，并利用初赛数据进行多标签多分类学习。值得关注的是，该团队以较量为契机，将 ViSNet 迁徙到了飞桨 PaddlePaddle 框架进行了实现，最终获得了更优的后果。

来自中国科学院上海药物研究所的蓝风信团队，应用 Unimol 和 KANO 预训练模型和分子指纹，联合残差网络进行 PaddleHelix 中 GEM 模型的优化，基于 ADMET 问题的较好体现，应用了各种常见的指纹模式，并通过扭转网络架构将这些信息融入。此外，模型翻新点还有应用 Resnet 代替简略的线性层提取 GEM 完结后的图表征信息。在复赛数据处理方面，团队奇妙地应用复赛数据训练出的模型给初赛数据打上标签，应用这种标签训练了用于复赛的模型，并且额定收集了数据来保障模型最终的体现。

来自上海交通大学的 MolAI 团队，应用通过大规模数据集预训练所失去的预训练模型在预测药物分子亲和度的上游工作上做 finetune。团队的办法应用了 4 个基于预训练模型预测的后果去做 ensamble。其中，4 个模型能够大抵分为基于图示意的学习和基于序列信息的学习。基于图示意的学习采纳 GNN 去提取分子图的特色，基于序列信息的学习则应用 Transformer 去提取序列的特色。最终，团队的计划也获得了不错的成果。

本次较量，要求选手基于飞桨 PaddlePaddle 实现算法的搭建，较量过程中，咱们提供了基于百度飞桨螺旋桨（PaddleHelix）工具的基线及一系列赛事培训，以赛促学，让更多选手关注 AI 药物研发畛域。值得一提的是，在本次总决赛的队伍中，有不少团队是从其余畛域跨界而来，比方来自金融科技领域的 paipai 团队，来自软件开发畛域的 得闲饮茶团队，这次较量，也成为了其余畛域选手入门和退出 AI 药物研发畛域的一次敲门砖。

15 支队伍载誉而归，AI 制药将来可期

获奖团队合影

在颁奖典礼和闭幕式上，百度飞桨教育生态经营负责人钱芳示意，医药工业，它关系到国计民生，是实现衰弱中国建设的重要基石。2022 年 5 月，百度飞桨联结清华大学药学院，筹备建设“AI+ 药学”产学研交融翻新基地，推出了一系列 AI+ 生物计算前沿课程和人才培养打算，旨在为 AI 药物研发畛域的人才培养提供重要平台。此次赛事的胜利举办，也是飞桨与清华药学院在 AI+ 药物研发畛域产教交融的重要一环。

面向未来，飞桨心愿与以清华大学药学院为代表的产学研用各方携手致力，放慢我国 AI 制药产业的人才培养，独特创始我国 AI 制药畛域的新场面。

正文完