乐趣区

关于人工智能:盘点-从单目标优化到多目标优化3D-打印材料开发进入-100X-倍速阶段

本文将聚焦 3D 打印资料开发,用四个具体案例对目前先进办法进行解读,以期让读者从整体上对机器学习在资料开发利用方面有认知和把握。

本文首发自 HyperAI 超神经微信公众号~

以 AlphaFold 为代表,机器学习在生物制药、蛋白质构造预测等畛域,曾经有了喜人的研究成果,尤其是几何深度学习 (Geometric deep learning) 在原子结构建模方面获得的微小停顿,无望为计算材料科学中开放性问题提供解决思路。

然而,与药物样分子 (drug-like molecule) 和蛋白质相比,资料建模也面临两个次要挑战:

  • 大部分资料没有适合的示意办法。开发胜利的机器学习模型,须要特定资料的演绎偏置 (inductive biase),这要求输出必须是具备肯定格局或法则的,比方咱们能够用 2D 图构造来示意分子,用序列示意蛋白质,这在资料畛域是无奈实现的,加上大部分资料须要在周期性边界条件 (periodic boundary conditions) 下进行示意,这给表征学习和生成模型都带来了很大挑战。
  • 资料类别形形色色、多种多样,如有机晶体、聚合物、催化外表、纳米多孔资料等等,每种资料构造的示意办法不同,都须要专属 task/ 数据集。

尤其以 3D 打印资料的开发和性能优化为例,更面临着适度依赖专业知识、反复试验、性能取舍等方面的制约。本文将围绕该主题,分享当下前沿的科研成果和办法。

3D 打印 + 机器学习:成绩亮眼

聚焦单指标优化

1. 波士顿大学:A Bayesian experimental autonomous researcher for mechanical design(2020)

浏览残缺论文:

https://www.science.org/doi/full/10.1126/sciadv.aaz1708

基于贝叶斯优化的主动 3D 打印和测试平台,能够减速高压缩韧度 structure 的摸索。联合贝叶斯优化和高通量自主试验,科研人员开发了一个贝叶斯试验主动研究员(Bayesian experimental autonomous researcher,简称 BEAR),除疾速试验外,BEAR 还基于所有可用后果对试验进行迭代。

用 BEAR 钻研增材制作组件力学

利用 BEAR,科研人员能够摸索 structure 参数家族的韧度,同时使得辨认高性能 structure 所需的试验数量,与基于网格的搜寻相比缩小了近 60 倍。这些结果显示了机器学习在数据稀少的试验畛域的价值。

  1. 纽约大学:Combining automated microfluidic experimentation with machine learning for efficient polymerization design(2020)

浏览残缺论文:

https://www.nature.com/articles/s42256-020-0166-5

科研人员开发了一个微流控反应器 (microfluidic reactor),用于筛选锆茂(zirconocene,一种化合物)催化剂,并联合拉丁超立方算法,进步催化剂的开发效率。

锆茂金属催化剂主动热成像微反应器零碎工艺流程图

在试验过程中,科研人员提出了一个用机器学习辅助主动显微化学反应器 (machine-learning-assisted automated microchemical reactors) 钻研聚合反应的方法论,采纳自行设计的微反应器原型,联合自动化和原位红外热成像技术,进行了高效、迅速的试验,绘制锆茂金属聚合催化剂的反馈空间,取得根本动力学参数。

试验使得化学废物缩小了两个数量级,催化剂的发现从数周缩小到数小时。

  1. 英国利物浦大学:A mobile robotic chemist(2020)

浏览残缺论文:

https://www.nature.com/articles/s41586-020-2442-2

科研人员开发了一个移动机器人(模块化、灵便、可自行挪动,而非仪器)寻找更优的水中制氢光催化剂。

机器人及实验台

该机器人自主运行超过 8 天,由一系列贝叶斯搜索算法驱动,在具备 10 个变量的空间内,进行了 688 次试验。

结果表明,这种自主摸索得出的光催化剂混合物的活性,比最后的配方高 6 倍。

聚焦多指标优化

主动量子点合成机器人诞生,整合了一个基于机器学习的试验抉择和流体化学来摸索多指标性能。然而,整个过程是在流体中进行的,这也导致肯定水平上无奈涵盖某些更简单的配方 - 加工 - 性能关系。

同时,每次试验的老本和耗时都很高,资料供给比拟无限,因而,收集大量的数据成为艰难。此外,对于许多事实中的利用,通常要满足多个性能规范,而这也减少性能空间摸索的复杂性,很难找到最优解。

这种状况下,领导设计空间采样的多指标优化办法则能够无效缩小试验次数。

  1. 麻省理工学院:Accelerated discovery of 3D printing materials using data-driven multiobjective optimization

浏览残缺论文:

https://www.science.org/doi/10.1126/sciadv.abf7435

科研人员利用机器学习减速具备最佳机械性能制约 (trade-off) 的增材制作 (additive manufacturing) 资料的开发。同时开发了一个多指标优化算法,通过提出混合次要配方创造性能更佳的资料,从而主动领导实验设计。

该零碎的 workflow 示意图

(A)配方调配。

(B)配方混合。

(C)用于样品制作的 3D 打印机。

(D)样品后处理与紫外线 (UV) 固化和加热。

(E)性能数据提取的压缩试验。

(F)贝叶斯优化算法的配方和性能评估,输入倡议的新配方测试。

该算法与一个半自主制作平台相结合,可大大减少执行试验的数量和解决问题的总工夫。在不理解次要配方的状况下,所提出的办法自行开发了 12 种最佳配方,并在 30 次试验迭代后将发现的性能空间扩充了 288 倍。这种办法无望轻松地推广到其余资料设计零碎并实现资料的主动发现。

试验结果表明,实现一个迭代周期的试验只须要 6797 秒(不到 2h),只有转运样品的步骤须要人工实现,极大减速了 3D 打印资料的开发流程。

又一片市场蓝海,谁能笑着胜出?

阿里云《2021 年 3D 打印行业倒退钻研报告》中显示,近年来,3D 打印受到国内社会的宽泛关注。以美国为例,其在 3D 打印技术上投入大量的人力、物力和财力,研发出更为丰盛的打印资料,促使这一技术日趋成熟。目前 3D 打印也已成为美国增长最快的工业之一。

与此绝对,国内在资料开发方面起步较晚,但随着国家的重点关注,3D 打印行业市场潜力无疑微小。有行业机构预测,2025 年中国 3D 打印市场无望增长至 635 亿元,其中 3D 打印资料约占三分之一,市场规模将达数百亿。能够推断,3D 打印行业已成为引领新一轮产业改革的核心技术之一,而 3D 打印资料作为其中的中上游,重要性显而易见。

现在来看,在这片微小的蓝海中,机器学习正凭借其弱小的预测性能,减速驱动 3D 打印行业的倒退。因而,对于泛滥企业而言,谁能领先抓住机遇在其中胜出,也将意味着将顺利站上改革风口。

退出移动版