关于机器学习:药物-3D-打印新突破圣地亚哥大学用机器学习筛选喷墨打印生物墨水准确率高达-9722

45次阅读

共计 4085 个字符,预计需要花费 11 分钟才能阅读完成。

内容一览: 药物喷墨打印是一种高度灵便和智能化的制药形式。据相干报告统计,该畛域市场规模将在不久的将来出现指数级增长。过往,筛选适合生物墨水的办法费时且费劲,因而也成为药物喷墨打印畛域面临的次要挑战之一。为解决这一问题,国内药剂学期刊《International Journal of Pharmaceutics: X》上公布了一篇研究成果,利用机器学习模型来预测墨水可打印性,预测准确率高达 97.22%。
关键词: 喷墨打印 3D 打印 随机森林

本文首发自 HyperAI 超神经微信公众平台~

依据新华社在 2022 年公布的一篇报道,药物研发周期通常长达 10-15 年,资金投入约为 10-20 亿美元,其技术提高和迭代十分迟缓,尤其以制药畛域最成熟的剂型之一固体制剂为例,100 多年来并未呈现颠覆性技术, 其投产上市仍面临着活性药物成分稳定性、开释动力学和生物利用度等关键性阻碍。

传统制药办法尽管实用于繁多制剂的大规模生产,然而在晚期临床试验中,通常会对药物进行剂量递增的钻研,以确定最佳及最平安的患者剂量,因而对于较小批量的试验药物,传统制药办法并不实用。

3D 打印因其具备高度灵活性,且生产过程数字化、间断化, 在药物设计、制作和应用上,可能肯定水平上减缓甚至克服以上阻碍。

其中,药物喷墨打印不仅提供了数字化管制打印的能力,还具备管制剂量和自在设计的劣势,为个性化给药提供了可能。药物喷墨打印中, 墨水个性的优化以及印刷成果始终以来都是钻研的焦点, 以往钻研人员会根据奥内佐格数来预测墨水的可打印性,然而,这种传统预测办法往往会不精确。

近期,来自圣地亚哥德孔波斯特拉大学 (Universidade de Santiago de Compostela) 的 Paola Carou-Senra 以及来自伦敦大学学院 (University College London) 的 Jun Jie Ong 等钻研人员开创性地将机器学习模型利用于预测生物墨水可打印性,并胜利地进步了预测率。 目前该钻研已公布在《International Journal of Pharmaceutics: X》期刊上,题目为「Predicting pharmaceutical inkjet printing outcomes using machine learning」。

图 1:该研究成果已发表在《International Journal of Pharmaceutics: X》

论文地址:
https://www.sciencedirect.com/science/article/pii/S2590156723…

试验概述

奥内佐格数 (Ohnesorge) 是流体力学中用来度量黏性力与惯性力和表面张力的互相关系的无穷纲数, 次要用于预测墨水的可打印性。可打印配方中,0.1 < Ohnesorge < 1,即 1 < Z < 10 (Z 值是 Ohnesorge 倒数) 时,通常认为墨水可打印。然而很多例外情况下,Z > 10 时墨水也是可打印的。

图 2:可打印配方 Z 和 Ohnesorge 的直方图和箱线图

如图 1 所示,本钻研中可打印墨水配方中的 Z 值处于 1 至 62.2 之间,其中有 68 组墨水配方的 Z 值大于 10。由此可见, 单纯根据 Z 值来预测可打印性并不精确。 为了进步可打印性预测的准确度,钻研人员采纳了机器学习模型,并比照了几种不同模型性能。

试验过程

数据集

本钻研数据集蕴含从 Google Scholar, PubMed, Web of Science, PubChem, the Handbook of Pharmaceutical Excipients (9th ed.) 上收集的 2000 年 5 月至 2022 年 2 月期间出版的 75 篇英文文献的研究成果,同时还增加了 2 种外部配方信息。最终, 数据集共有 687 种配方。 其中,可打印配方 636 种,占总配方的 92.6%,不可打印配方 51 种,占 7.4%。

数据集中包含与喷墨打印过程无关的参数信息,具体变量如下图所示:

表 1:打印过程中的变量

模型开发

本项钻研中, 钻研人员开发了三种机器学习模型:人工神经网络 (artificial neural networks, ANN)、反对向量机 (support vector machines, SVM)、随机森林 (random forests, RF),并通过计算其科恩卡帕系数 (the Cohen’s kappa coefficient, kappa)、断定系数 (coefficient of determination, R²) 和均匀绝对误差 (Mean Absolute Deviation, MAE), 比照得出最佳预测模型。同时,试验过程中,钻研人员还探索了模型、特色集以及超参数的组合关系。

  • kappa: kappa 是一个用于测验一致性的指标,也能够用于掂量分类的成果,可检测模型预测后果和理论分类是否统一。 其取值范畴为 -1 到 1 之间,通常大于 0, 其中 1 代表完全一致,0 代表随机统一,-1 代表齐全不统一。
  • R²: 断定系数,又称可决系数、决定系数,该指标建设在对总离差平方和进行合成的根底之上,用来阐明 回归 方程对观测数据拟合水平的一个度量值。 断定系数越高,阐明对观测数据的拟合水平越好,反之断定系数越小,拟合水平越差。
  • MAE: 均匀绝对误差,又称均匀相对离差,示意预测值和观测值之间绝对误差的平均值,因此能够精确反映理论预测误差的大小。其取值范畴为 [0,+∞), 当预测值与实在值齐全吻合时等于 0,即完满模型;该值越大,误差越大。

超参数调优

可打印墨水尽管可喷射,但也可能会产生卫星液滴,这种形态会导致印刷不精确,是评估墨水品质的重要指标。同时,墨水中药物有余的话,打印的药物无奈达到医治成果,因而墨水中药物的含量也是评估品质的重要指标。因而, 本钻研中模型除了被用来预测墨水的可打印性,还被用来预测可打印墨水的品质以及墨水中药物剂量。

在预测这两个不同方面的试验中, 研发人员对模型超参数进行了优化, 其中,初始状态下模型默认超参数如下表:

表 2:模型默认超参数

超参数,是机器学习算法中须要手动设置的一些参数。通常状况下, 超参数的值对于模型性能和泛化能力有很大的影响。 超参数调优(或超参数优化)是通过肯定办法,主动寻找最优参数组合的过程。钻研人员首先为每个模型预约义了可能取值汇合,再通过对训练集进行 5 倍穿插验证的网格搜寻来确定最佳超参数值,最初优化后的机器学习模型被利用于测试集。

试验后果

在预测墨水可打印性方面,最佳预测模型为 RF 模型。钻研人员指出通过优化后的 RF 模型准确率为 97.22%,kappa 系数为 0.854, 这阐明该模型在预测可打印性上准确率高且牢靠。

在预测墨水品质,即预测可打印墨水是否产生卫星液滴方面, 最佳预测模型为 ANN 模型。 钻研人员指出通过优化后的 ANN 模型准确率为 97.14%,kappa 系数为 0.74。这里他们也强调,kappa 系数思考了偶尔得出正确预测的可能性,所以数据集 (数据集中大部分为可打印配方,不可打印配方占比极小) 会绝对不平衡,不过即便如此,模型取得的分数和准确率表明预测是牢靠的。

制药喷墨打印时,预测药物剂量方面,最佳预测模型为 RF 模型。这里,钻研人员指出如果采纳预约义超参数及资料名称分组的特色集,RF 模型性能最佳;如果移除残差数据集最小 阈值, 最佳预测模型为 ANN 模型, 下图为训练两个模型不同的数据集。

如图 3 所示,两个数据集的测量药物剂量的散布类似,但用于训练 RF 模型的数据集规模更大,且药物剂量在 2.5-5.0mg 之间的数据比例绝对较高(药物喷墨打印中应用的典型药物剂量范畴)。因而, 只管 ANN 模型的体现略好于 RF 模型,但 RF 模型更适宜于优化。 优化模型后的 RF 模型的 R² 为 0.800,MAE 为 0.291,表明其能够预测药物剂量,误差在 ±0.291 mg 范畴内。

图 3:训练 RF 和 ANN 模型数据集中测量药物剂量图

综上, 机器学习模型可能预测可打印墨水的可打印性、打印质量,同时还可能预测药物剂量, 其中,不同算法和特色集还能对预测后果产生不同影响。

药物 3D 打印:推动产业走向数字化

3D 打印在药物研发的晚期阶段,提供了更大的灵活性,只需调整几个参数,就能够更容易地扭转药物的形态、大小、剂量、开释状况等, 放慢临床试验的进度、缩短新药上市的周期。 同时,还能通过为患者量身定制准确剂量,提供个性化医学医治。

2015 年 7 月,美国制药公司 Aprecia 利用 3D 打印技术制备的处方药 SPRITAM(左乙拉西坦)速溶片上市,用于医治癫痫。这是寰球首个取得美国食品药品监督管理局 (FDA) 批准的 3D 打印药物, 标记着药物 3D 打印已成为事实,同时也掀起了一轮 3D 打印药物的钻研热潮。 尔后,Aprecia 依据本身劣势,胜利转型为一家药物制剂技术平台公司,并与普渡大学药剂学院等科研机构以及大型跨国药企积极开展单干、促成新药研发。

放眼国内, 成立于 2015 年的南京三迭纪医药,则堪称国内 3D 打印药物畛域的引领者。 三迭纪医药由成森平博士和美国制剂界专家和教育家李霄凌 (Xiaoling Li) 传授独特创建,成立至今,其独创了 MED 技术,胜利开发了从药物剂型设计、数字化产品开发,到智能制药全链条的专有 3D 打印技术平台,其研发的 3 款 3D 打印药物–T19(针对类风湿性关节炎)、T20(升高非瓣膜病性房颤患者的卒中和全身性栓塞危险等)、T21(医治溃疡性结肠炎),均已取得美国 FDA 临床试验批准,进入临床阶段。

无疑,药物 3D 打印构建了数字化制药的根底,其市场远期需求量大、前景可期。依据 Grandview Research 公布的一份报告, 寰球药物 3D 打印市场或将在不久的将来出现指数级增长,预计到 2030 年,寰球药物 3D 打印市场将达到 2.6974 亿美元, 而老龄化的加剧,无疑发明了微小的个性化医疗窗口。置信在不久的未来,药物 3D 打印将重塑生物制药的商业格局。

参考链接:

[1]http://www.news.cn/mrdx/2022-09/13/c_1310662292.htm

[2]https://www.pudong.gov.cn/019010005/20221026/741820.html

本文首发自 HyperAI 超神经微信公众平台~

正文完
 0