8月26日,首届寰球AI药物研发算法大赛决赛问难暨颁奖典礼,在清华大学生物医学馆举办。来自微软研究院、中国科学院上海药物研究所、上海交通大学等单位的十五支团队,从寰球878支团队中怀才不遇,进入了决赛问难环节。

产教交融,共育AI药物研发人才

总决赛开幕式上,清华大学药学院副院长陈犯罪代表主办方致开幕辞,并对来自寰球高校、研究院所和企业的嘉宾参赛团队示意热烈的欢送。他示意,长期以来,药物研发面临老本高、成功率低的问题,而AI技术的倒退为此带来了新的时机。 清华大学药学院心愿通过较量,促成高校、科研院所与企业在AI+药学畛域的单干与倒退,解决制药畛域的难题,同时可能从大赛中,孕育更多AI与生物医药交叉学科的人才。本次大赛的次要内容是预测小分子在细胞程度是否可能克制新冠病毒,是一个分子示意学习的问题,也是药物化学与小分子药物设计中的关键问题!

总决赛评委,别离为中国科学院上海有机化学研究所丁克传授、上海交通大学医学院药物化学与生物信息学核心主任张健传授、罗氏中国翻新核心AIDD负责人林翼博士、清华大学药学院田博学副教授和百度资深产品设计师,飞桨螺旋桨PaddleHelix产品负责人张肖男女士

专家评委们对团队的问难进行发问并提出贵重倡议

总决赛团队逐鹿清华,问难现场“神仙打架”

来自微软亚洲研究院的ViSNet-Drug团队,利用自主研发的AI2BMD动力学模拟系统和预训练的ViSNet模型。在初赛中, AI2BMD对小分子和靶点蛋白Mpro的联合自在能进行准确计算并对数据进行pseudo label标注。AI2BMDk可对超过10,000原子的蛋白质模仿,达到靠近密度泛函实践(DFT)的精度的能量计算并缩短了数个数量级的计算工夫。在复赛中,团队利用AIMD-Chig数据集对ViSNet模型进行预训练,并利用初赛数据进行多标签多分类学习。值得关注的是,该团队以较量为契机,将ViSNet迁徙到了飞桨PaddlePaddle框架进行了实现,最终获得了更优的后果。

来自中国科学院上海药物研究所的蓝风信团队,应用Unimol和KANO预训练模型和分子指纹,联合残差网络进行PaddleHelix中GEM模型的优化,基于ADMET问题的较好体现,应用了各种常见的指纹模式,并通过扭转网络架构将这些信息融入。此外,模型翻新点还有应用Resnet代替简略的线性层提取GEM完结后的图表征信息。在复赛数据处理方面,团队奇妙地应用复赛数据训练出的模型给初赛数据打上标签,应用这种标签训练了用于复赛的模型,并且额定收集了数据来保障模型最终的体现。

来自上海交通大学的MolAI团队,应用通过大规模数据集预训练所失去的预训练模型在预测药物分子亲和度的上游工作上做finetune。团队的办法应用了4个基于预训练模型预测的后果去做ensamble。其中,4个模型能够大抵分为基于图示意的学习和基于序列信息的学习。基于图示意的学习采纳GNN去提取分子图的特色,基于序列信息的学习则应用Transformer去提取序列的特色。最终,团队的计划也获得了不错的成果。

本次较量,要求选手基于飞桨PaddlePaddle实现算法的搭建,较量过程中,咱们提供了基于百度飞桨螺旋桨(PaddleHelix)工具的基线及一系列赛事培训,以赛促学,让更多选手关注AI药物研发畛域。 值得一提的是,在本次总决赛的队伍中,有不少团队是从其余畛域跨界而来,比方来自金融科技领域的paipai团队,来自软件开发畛域的得闲饮茶团队,这次较量,也成为了其余畛域选手入门和退出AI药物研发畛域的一次敲门砖。

15支队伍载誉而归,AI制药将来可期

获奖团队合影

在颁奖典礼和闭幕式上,百度飞桨教育生态经营负责人钱芳示意,医药工业,它关系到国计民生,是实现衰弱中国建设的重要基石。2022年5月,百度飞桨联结清华大学药学院,筹备建设“AI+药学”产学研交融翻新基地,推出了一系列AI+生物计算前沿课程和人才培养打算,旨在为AI药物研发畛域的人才培养提供重要平台。 此次赛事的胜利举办,也是飞桨与清华药学院在AI+药物研发畛域产教交融的重要一环。

面向未来,飞桨心愿与以清华大学药学院为代表的产学研用各方携手致力,放慢我国AI制药产业的人才培养,独特创始我国AI制药畛域的新场面。