首届寰球 AI 药物研发算法大赛,是由清华大学药学院、百度飞桨、百度智能云和临港实验室独特主办,并失去中国药学会等单位大力支持的一项全球性技术创新大赛。旨在借助百度飞桨在生物计算方向上的算法劣势,通过 AI Studio 平台,摸索 AI+ 药学畛域前沿技术,开掘和培养优秀人才。上线一个月以来,吸引了来自全国 200 余所高校、100 余企业的 500 余支队伍、600 余名选手加入。
赛题背景
新冠病毒(SARS-CoV-2)自从其首次暴发以来,迅速成为寰球关注的焦点。为了抵挡新冠病毒的攻打,理解病毒的复制和感化机制至关重要。主蛋白酶(main protease,简称 M pro)是新冠病毒的要害酶,负责在感化过程中剪切病毒产生的蛋白质前体,促成病毒的复制。 主蛋白酶因其在病毒生命周期中的关键作用,成为潜在的医治靶点。克制该酶的活性能够无效烦扰病毒的复制过程,从而提供一种潜在的医治办法。
其中,人工智能的筛选办法,利用机器学习和深度学习技术,剖析大量构造和活性数据,从而实现对小分子与主蛋白酶之间相互作用的预测。
本次较量旨在激励参赛者利用人工智能办法,挖掘医治新冠病毒的潜在药物。
赛题链接
https://aistudio.baidu.com/aistudio/competition/detail/1012/0…
赛段设置
赛题工作解析
初赛阶段
大赛提供小分子对新冠病毒主蛋白酶的克制活性数据,参赛选手能够应用深度学习、分子对接等办法进行建模,预测小分子克制主蛋白酶活性的概率。
即给定分子(SMILES),预测克制主蛋白酶活性的概率。
复赛阶段
大赛提供小分子在 Caco 细胞上克制新冠病毒复制的活性数据,参赛选手须要基于 PaddlePaddle 进行模型的设计和训练,预测小分子在 Caco 细胞上克制新冠病毒复制的概率。
即给定分子(SMILES),预测 Caco 细胞上克制新冠病毒复制的概率。
评估指标
本次较量选用 AUC(ROC 曲线下面积)和 AP(PR 曲线下面积)的平均值作为评估指标。
$$
\text {score}=\frac{1}{2}(A U C+A P)
$$
Baseline 链接
https://aistudio.baidu.com/aistudio/projectdetail/6251614?sUi…
赛题培训
7 月 1 日(本周六)晚七点 , 入门培训 来了!为了帮忙更多新同学理解和入门较量,本次培训特邀清华大学药学院研究员、博士生导师田博学、清华大学药学院博士生陈靖轲、百度飞桨 Jungle 老师负责讲师!率领同学们深刻理解本次赛题工作的产业背景、赛题工作和破题技巧,逐行了解 baseline 的全流程代码!
田博学
清华大学药学院研究员,博士生导师,
次要从事计算化学和计算生物学相干钻研。
陈靖轲,清华大学药学院博士生
零根底入门,一举通关较量工作!
点击下方链接,立刻报名较量!
https://aistudio.baidu.com/aistudio/competition/detail/1012/0…