5周而不是50年:神经网络优化新材料的搜索

通过对数百万种可能性进行排序,对电池材料的搜索可以在5周内得到结果,而不是50年。

在搜索特定应用的可能新材料的理论列表时,比如电池或其他能源相关设备,通常有数百万种可能的材料可以考虑,而且需要同时满足和优化多个标准。现在,麻省理工学院的研究人员发现了一种方法,利用机器学习系统,极大地简化了发现过程。

作为演示,该团队从近300万候选材料中挑选出了8种最有希望的材料,用于一种叫做流电池的储能系统。他们说,按照传统的分析方法,这个淘汰过程需要50年的时间,但他们只用了5周就完成了。

这一发现发表在ACS中央科学杂志上,由麻省理工学院化学工程教授希瑟·库利克、19岁的乔恩·保罗·珍妮特博士、萨哈斯拉吉特·拉梅什和研究生Chenru Duan撰写的一篇论文中。

这项研究着眼于一组被称为过渡金属配合物的材料。这些物质可以以多种不同的形式存在,库利克说,它们是非常迷人的功能材料,与许多其他物质相不同。理解它们为什么以这种方式工作的唯一方法是用量子力学来研究它们。

要预测数百万种材料中的任何一种的性质,要么需要耗费大量时间和资源的光谱学和其他实验室工作,要么需要对每种可能的候选材料或材料组合进行耗时、高度复杂的基于物理的计算机建模。每次这样的研究都要花费数小时到数天的时间。

相反,库利克和她的团队选择了少量不同的可能材料,并用它们来教一个先进的机器学习神经网络了解材料之间的关系;化学成分及其物理性质。然后,这些知识被用于为下一轮神经网络训练可能使用的下一代材料生成建议。通过这一过程连续的四次迭代,神经网络每次都得到了显著的改进,直到到达一个很明显的点,即进一步的迭代不会产生任何进一步的改进。

这种迭代优化系统极大地简化了达到潜在解决方案的过程,满足两个相互冲突的标准正在寻求。这种寻找最佳解决方案的过程被称为帕累托阵线(Pareto front),它表示一个因素的任何进一步改善都会使另一个因素变得更糟。换句话说,根据分配给每个因素的相对重要性,该图表示了可能的最佳折中点。

训练典型的神经网络需要非常大的数据集,从数千到数百万的例子,但是库利克和她的团队能够使用这个基于Pareto front模型的迭代过程,简化过程并仅使用几百个样本提供可靠的结果。

在筛选流动电池材料的情况下,所期望的特性是矛盾的,这是经常的情况:最佳的材料应该有高溶解度和高能量密度(为给定的重量存储能量的能力)。但增加溶解度会降低能量密度,反之亦然。

神经网络不仅能够快速地找到有希望的候选对象,还能够在每次迭代中为其不同的预测指定置信水平,这有助于在每一步优化样本选择。我们开发了一种比同类中最好的不确定性量化技术,以真正了解这些模型何时会失败,Kulik说道。

他们在概念验证试验中选择的挑战是用于氧化还原流电池的材料,这种电池有望用于大型电网规模的电池,在实现清洁、可再生能源方面发挥重要作用。过渡金属配合物是这类电池的首选材料,库利克说,但是用传统方法评估的可能性太多了。他们一开始就列出了300万个这样的综合体,最后将其缩减为8个优秀的候选综合体,并制定了一套设计规则,使实验人员能够探索这些候选综合体及其变体的潜力。

通过这个过程,神经网络在设计空间方面变得越来越聪明,但也越来越悲观,认为任何超出我们已经描述的东西都可以在我们已经知道的基础上进一步改进dquo;她说。

她说,除了特殊的过渡金属配合物建议使用这个系统进行进一步的研究,这种方法本身可以有更广泛的应用。我们确实将其视为一个框架,可以应用于任何材料设计挑战,即你真的试图同时解决多个目标。你知道,所有最有趣的材料设计挑战都是那些你试图改善一件事,但改善会使另一件事恶化的挑战。对我们来说,氧化还原流电池氧化还原对我们来说是一个很好的证明,我们认为我们可以用这种机器学习和加速材料发现。

例如,优化各种化学和工业过程的催化剂是另一种复杂材料的研究,库利克说。目前使用的催化剂通常含有稀有和昂贵的元素,因此找到基于丰富和廉价材料的类似有效化合物可能是一个显著的优势。

我相信,这篇论文代表了在化学科学中多维方向改进的第一次应用。她说。但这项工作的长期意义在于方法论本身,因为否则可能根本不可能发生的事情。你开始意识到,即使是并行计算,这些情况下,我们也无法以任何其他方式提出设计原则。这些线索来自于我们的工作,它们并不一定都是已经从文献中知道的想法或者专家能够告诉你的。

这是统计学、应用数学和物理科学概念的完美结合,将在工程应用中极其有用。乔治·沙茨说,他是西北大学化学和化学生物工程的教授,他没有参与这项工作。他说,这项研究探讨了在有多个目标的情况下如何进行机器学习。kuliko的方法使用前沿的方法训练人工神经网络,用来预测过渡金属离子和有机配体的哪种组合最适合氧化还原流电池电解质。

沙茨说,这种方法可以在许多不同的情况下使用,因此它有潜力改变机器学习,这是世界上的一项主要活动。

参考文献:精确的多目标设计在数以百万计的过渡金属配合物的空间与神经网络驱动的高效的全局优化作者Jon Paul Janet, Sahasrajit Ramesh, Chenru Duan和Heather J. Kulik, 2020年3月11日,ACS中央科学。

这项工作得到了海军研究办公室、国防高级研究计划局(DARPA)、美国能源部、Burroughs Wellcome基金和美国科学促进会Mar ion Milligan Mason奖的支持。