Acta Mater.:基于机器学习的高熵合金设计系统
多尺度力学课题组——陶金(解读)
公众号链接: Acta Mater.:基于机器学习的高熵合金设计系统
由于传统试错法的耗时和未开发成分空间的巨大,有效发现具有优异性能的新型高熵合金(HEAs)仍存在挑战。近日, 上海大学李敏杰教授团队 提出了一种基于机器学习的合金设计系统(MADS),以促进高硬度HEA的合理设计。首先,作者构建了硬度数据库,然后通过四步特征选择筛选出影响HEA硬度的五个关键特征:原子量的平均偏差(ADAW),色谱柱的平均偏差(ADC),比体积的平均偏差(ADSV),帷形电子浓度(VEC)和平均熔点(Tm)。此外,作者构建了以5个特征为输入的基于支持向量机的硬度预测模型并训练。训练后的模型皮尔逊相关系数在测试集和交叉验证集都达到0.94。随后,作者通过实验合成了机器学习训练获得的几种优化组合物,表现出较高的硬度,比原始数据集中最高硬度高出24.8%。此外,作者还引入了Shapley解释算法(SHAP)以提高模型的可解释性,结果表明VEC在硬度预测中起着重要作用。MADS框架如图1所示。
高熵合金数据集包括Al-Co-Cr-Cu-Fe-Ni、Al-Co-Cr-Fe-Mn-Ni等高熵合金及其衍生物。通过数据预处理,最终保留370条数据,其中四元合金36个,五元合金178个,六组分合金132个,七元组分合金24个。人们普遍认为,数据和特征决定了ML的上限,而模型和算法只接近这个上限。在这项工作中,候选特征包括一些原子参数如帷形电子浓度(VEC)、原子大小差(δ)、混合焓(∆H ) 、混合熵(∆S ) 、平均熔点(Tm)以及固溶相形成参数(Ω)。总体而言,我们的原始特征池中共有 142个描述符,包括136个生成的原子特征和 6个相位参数,特征筛选过程如图二所示。作者通过优化算法的超参数,进一步提高了模型的性能并执行交叉验证以避免过拟合。基于获得的模型,作者通过逆投影和高通量筛选来寻找更高硬度的高熵合金并通过实验制备,并使用维氏硬度计对每个试样进行九次测试以获得硬度均值。作者采用Fisher方法对硬度进行分类,以寻找正样品(600 HV)。在本文中,作者对不同的机器学习方法进行评估,发现支持向量回归与径向基核函数(SVR-rbf)性能最佳。
如图3所示。以RMSE和R作为评估指标,作者估计预测硬度与实验硬度之间的误差和相关性。作者将原始数据集以4:1的比例随机拆分为训练集和测试集并根据所选特征重建模型。对于10倍交叉验证集和 LOOCV,训练集的平均R分别为 0.94 和 0.95。对测试集,R的平均值为0.93。利用机器学习生成的合金Co18Cr7Fe35Ni5V35显示卓越的硬度,比原始数据库中的最佳值高24.8%。
相关研究成果以“A machine learning-based alloy design system to facilitate the rational design of high entropy alloys with enhanced hardness”为题发表在Acta Materialia上(Volume 222, January 2022, Article number 117431),论文的第一作者为ChenYang,通讯作者为Minjie Li和Wencong Lu。
论文链接: