关于人工智能:DMFF分子力场开发新利器

3次阅读

共计 1598 个字符,预计需要花费 4 分钟才能阅读完成。

分子体系模仿与分子力场

分子体系模仿 在生物大分子结构预测、药物筛选、有机资料筛选等畛域具备重要利用价值。

分子体系的模仿中最重要的就是刻画体系势能函数、形容相互作用。在经典分子动力学模仿 (CMD) 中,势能函数遵循固定的数学模式,而 分子力场 即以数学函数的模式给出了分子间与分子内相互作用势。

                                传统力场的数学模式

然而,目前投入工业化利用的分子力场广泛面临着这样几个问题:

  • 不足可移植性和预测能力:钻研新体系时,在真正跑出后果之前,恐怕谁都不确定哪个力场后果更好。除了靠“教训”,谁也说不清楚力场应该怎么选。
  • 参数短少唯一性和一致性:经常出现多套齐全不同的参数能给出类似的宏观预测,因而不能仅通过宏观数据确定宏观上哪套参数更为正当。同时,咱们也经常能看到十分类似的体系,力场参数却齐全不同,因而不同课题组倒退的力场往往不能组合应用。

机器学习与主动微分技术

在分子力场拟合畛域,提起 机器学习,绝大多数同学可能想到的是人工神经网络架构:

确实,不论是晚期的 Behler-Parinello 模型、Schnet 模型,还是更近期的 DP 模型、或是 REANN 模型,其外围做法,都是将原子的势能面拆解为单个原子能量的求和:

并利用神经网络的超强拟合能力,以原子局域环境为输出特色(feature),构建原子能量函数:

而后利用大量的第一性原理数据对神经网络进行训练。人工智能技术在分子动力学畛域掀起的这一波浪潮次要就是由神经网络势函数所带动。

然而,人工智能技术所带来的变革,绝不只是神经网络势函数。与神经网络模型倒退相随同的技术创新,包含弱小的高维梯度降落算法,和底层的主动微分程序框架,都能够被传统力场开发者所用,这就是 DMFF 诞生的次要起因。

在神经网络训练过程中,咱们须要通过反向流传,计算网络输入对网络参数的微分,并利用梯度降落实现整个神经网络的优化。因而,主动微分框架与机器学习模型的训练相伴而生,能够说主动微分技术自身就是为了大量数据下高维参数的高效优化而生。包含 DP 在内的神经网络势能面的训练,其实都是基于主动微分技术实现的。

                        基于反向流传主动微分算法的神经网络训练

DMFF 入手实际

只管最早是被用于机器学习模型,但主动微分技术自身并不依赖于机器学习模型。须要微分和优化的计算流能够是任何物理模型。因而,咱们齐全能够利用主动微分和梯度降落技术,利用试验和第一性原理数据,通过反向流传去优化任何物理模型的参数。而 DMFF 正是这一想法在分子力场畛域使用的实例。

通过 DMFF,咱们对分子力场开发的两大难题作出回应:

  • 如何保障分子动力学模仿过程中简单力场的疾速实现与迭代。
  • 如何晋升高维度函数中优化参数的效率以及这一过程的自动化水平,并晋升参数的可迁移性。

在最新公布的 DMFF 0.2.0 版本中,摸索出了一条 力场参数主动优化 的门路,相应的工作流在比较简单的小分子体系与较为简单的电解液体系中都失去了验证。

在上面的 Notebook 中,咱们会 “手把手” 带你亲手构建分子力场、生成与拓展势函数、通过 DMFF 进行简略的拟合并以理论案例搭建力场参数优化的工作流。你无需放心环境配置和依赖问题,仅须要专一于学习自身。依附 收费的 2 核 4G 计算资源,你能够在平台上间接运行和批改代码。

Notebook 链接:https://nb.bohrium.dp.tech/detail/1254

通过这个 Notebook,置信你对以下问题曾经有了更好的了解:

  • 什么是 DMFF
  • DMFF 的根本工作流
  • DMFF 是如何实现力场的疾速迭代与参数优化的

致谢:
感激 Notebook 作者韩言博、陈俊敏、冯维、余旷老师的分享。感激作者单位清华大学深圳国内研究生院的反对。

欢送关注咱们的微信公众号 NBHub,获取更多乏味的 Notebook 实际~感兴趣的童鞋能够查看原文:https://mp.weixin.qq.com/s?__biz=Mzg5NTk3Nzk3MQ==&mid=2247483…

正文完
 0