编辑/绿萝
大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。
来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。
该研究以「 Predicting energy and stability of known and hypothetical crystals using graph neural network 」为题,发表在《 Patterns 》杂志上。
晶体内部结构中的原子有规则地在三维空间呈周期性重复排列。测量这些晶体结构稳定性的一种方法是计算它们的总能量——较低的总能量转化为较高的稳定性。单一化合物可以具有许多不同的晶体结构。为了找到能量最低的结构:基态结构。研究人员依赖于计算成本高昂的高保真数值模拟。
如果在电极和电解质之间的界面形成竞争相,固态电池会失去容量和电压。寻找相容的材料,确保材料不会分解。但候选的领域很广:估计表明有数百万甚至数十亿种似是而非的固态化合物等待被发现。
「你无法对这个潜在晶体结构空间的大片区域进行这些非常详细的模拟。」NREL 研究员 Peter St. John说。「每个都是非常密集的计算,在大型计算机上需要几分钟到几小时。」 然后,人类必须梳理所得数据,以手动识别新的预期材料。
为了加速这一过程,研究人员使用了一种称为图神经网络的机器学习形式。图神经网络是一种经过训练可以检测和突出显示数据模式的算法。在这里,「图」本质上是每个晶体结构的图。该算法分析每个晶体结构,然后预测其总能量。
对于基准测试,研究人员在来自 NREL 材料数据库 (NRELMatDB) 的 ICSD(无机晶体结构数据库) 结构的 DFT 总能量上训练 CGCNN 模型。该模型在 15,500 个晶体结构上进行了训练,每个结构都保留了 其中 500 个用于验证和测试。
GNN 模型架构。
然而,任何神经网络的成功都取决于其用来学习的数据。科学家们已经确定了超过 200,000 种无机晶体结构,但还有很多的可能性。一些晶体结构起初看起来很稳定——直到与较低能量的化合物进行比较才会发现并非如此。研究人员提出了假设的、更高能量的晶体,可以帮助机器学习模型提高分辨看似稳定的结构和实际稳定结构的能力。
「要训练一个能够正确预测结构是否稳定的模型,你不能只给它提供我们已经知道的基态结构。你必须给它这些假设的高能结构,这样模型才能区分这两者,」St. John说。
为了训练他们的图神经网络,研究人员创建了基于量子力学计算而不是自然的理论示例。通过在训练数据中同时包含基态和高能晶体,与仅在基态结构上训练的模型相比,研究人员能够获得更准确的结果。研究人员模型的平均误差比对比案例低五倍。
具体而言,研究人员使用 Kendall 等级相关系数 (KRCC) 作为度量来比较不同模型和数据集之间预测能量等级的准确性。
当在相同的组合数据集上训练时,GNN 模型、MEGNet 和 CGCNN 模型具有相似的平均 KRCC。与仅在 ICSD 结构上训练相同模型相比,这是 KRCC 的显着改进。因此,训练数据的选择起着更关键的作用,而实际模型架构对模型在结构能量排名中的性能影响较小。
不同数据集和模型的能源排名比较。
这种方法可以彻底改变研究人员发现具有宝贵特性的新材料的速度,使他们能够快速地发现最有前途的晶体结构。科罗拉多矿业学院的研究教授 Gorai 说,这项工作具有广泛的相关性。
「两种固体相互接触的情况发生在许多不同的应用中——光伏、热电、各种功能设备。」Gorai 说。「一旦该模型成功,它就可以部署在固态电池之外的许多应用中。」
论文链接:https://doi.org/10.1016/j.patter.2021.100361
参考内容:https://techxplore.com/news/2021-12-machine-method-battery-materials.html