非贵金属氧还原电催化剂的开发已经取得很大进展,部分催化剂的半电池性能可与铂基催化剂相媲美,但在全电池上性能仍然低很多,这是因为除了非铂催化剂本身催化活性外,影响全电池输出功率的因素还有很多。 因此要想获得优化的全电池数据,除了筛选高性能非铂催化剂之外,还需要在全电池层面开展不同温度、压力、催化剂载量、Nafion含量等因素影响,即便采用了正交实验设计,实验工作量巨大,导致工作效率低下。
此外,在分析宝贵的实验数据同时,即使是经验丰富的工作者也很难将高维模型的众多变量直接关联起来得出具有普适性结论来指导实验工作。 将人工智能辅助设计引入燃料电池非铂催化剂的设计可以有效解决这个问题。
近日 , 现代工程与应用科学学院刘建国教授团队 首次将人工智能(AI)引入到基于非贵金属电催化剂的质子交换膜燃料电池研究领域,辅助其优化性能测试参 数,从而减少电池开发过程中不必要的实验。
本研究整理了来自近10年本领域相关文献报道的超过10000个数据点,记录包括从催化剂元素组成,微观结构到燃料电池的操作条件与输出性能的信息构建数据库,采用人工智能领域广泛应用的16种算法进行学习建立数据驱动模型并为材料设计提供建议。
相关成果以“Designing AI-aided analysis and prediction models for nonprecious metal electrocatalyst-based proton exchange membrane fuel cells”为题,于2020年7月13日在《德国应用化学》( Angewandte Chemie International Edition )上发表。 本文第一作者为南京大学现代工程与应用科学学院博士生丁睿,通讯作者为李佳副研究员与刘建国教授,南京大学为唯一通讯单位。
论文链接:
https://onlinelibrary.wiley.com/doi/10.1002/anie.202006928
图1.
文章图形摘要
首先,从催化剂元素组成、微观结构到燃料电池器件中的载量配比,操作条件等26个特征被从数据 库中提取并作为输入变量,输出体现为最大功率密度是否达到高性能标准(二分类)。
分类决策树算法被用于对大数据进行筛选分析并基于此为研究人员提供获得高性能的建议:决策树中的每一个子节点都会依据集合纯度选择特征种类与决策边界。经过训练后,拟合完成的决策树在拥有高分类准确性(86.7%)的同时,研究者在可视化决策树时发现其智能地获得了与本领域过往研究达成的共识相高度吻合的结论:
-
在保证较高的总铁元素与氮元素含量时,提升吡啶氮与金属-氮物种比例,以获得更高密度活性位点。除此之外,硫元素掺杂亦有助于提升性能;
-
采用高比表面积(大于900m2/g)的材料有利于活性位点的充分暴露,但同时介孔/大孔被建议保留30%以上的比例以保证传质;制备膜电极(MEA)时,非贵金属催化剂的载量被建议限制在4.1mg/cm2以下以防止过厚的催化层阻滞物质输运,同时配置浆料中离聚物/催化剂的比例被建议在0.57以下;
-
选用100μm厚度以下的膜同时保持高湿度有助于提升质子输运性能;
-
施加1bar以上的背压同时提供大于350sccm的氧气流速有助于提升功率输出。
图2.
决定获得高最大输出功率密度条件的分类决策树示意图
集成算法XGBoost 被进一步引入以对抗决策树的过拟合缺陷并提升分类准确率(91.4%),并且在此基础之上,对涉及到的总计26的特征进行了重要性程度排序。
通过F-score统计,AI认为起到决定性因素的前五个因素分别为:背压,阴极催化剂担载量,催化剂比表面积,催化剂铁元素含量与浆料中离聚物/催化剂的比例。而在26个特征中,与燃料电池操作条件相关的13个因素大多被排列在催化剂微观层面化学结构特征之前。
在许多研究非贵金属基氧还原催化剂的工作中常被给予大量关注的催化剂氮元素物种比例,通常被认为代表活性位点结构的信息,在此却则给予了较低的重视程度。这种部分符合本研究领域现在的矛盾:即一些文献中报道的在半电池测试中可媲美商业铂基催化剂的非贵金属催化剂,在膜电极中应用时,却仅表现出一般水平的性能。这很可能是因为催化剂在燃料电池全电池中与在半电池中测试时,其反应路径、接触界面和传质过程可能完全不同。
在数据库的构建过程中,本领域许多声称为氧还原反应合成了高活性非贵金属催化剂的研究工作仅在半电池测试中给出了数据。而应用于膜电极中并组装质子交换膜燃料电池进行用于实际应用的评测应是最基本的目标,却常常被本领域的研究者忽略。因此,AI提出的建议可以被解读为研究者需基于实际应用为原则进行本领域的催化材料设计和评估,这样方能加速非铂催化剂的实用化进程。
图3.
XGBoost 算法对非贵金属及催化剂质子交换膜燃料电池中的参数重要性特征排序示意图
为了建立准确的预测模型,本研究选取了简单线性回归算法到人工神经网络的16种机器学习算法进行相互竞争。首先,网格搜索被运用于每一种算法的超参数组合优化以获得该算法完成预测任务的准确度极限。通过将相关系数R2与均方误差RMSE作为评价标准,人工神经网络(ANN)获得了最佳的拟合程度(R2=0.9621)与最低的预测误差(RMSE=58.5)。
因此,研究者进一步调用数据库中的电流-电压极化曲线对人工神经网络进行训练,发现训练后的人工神经网络的预测结果能够很好地重现测试集中真实的实验数据(R2>0.99)。
由此可见,随着这一领域不断发展,快速、准确的AI预测将有可能替代繁复的实验。并且,这种方法也可以应用于其他需要大量时间、实验和高维空间设计的领域,从而实现研究方式的革命性转变。
图4.
a) 人工神经网络的训练误差与验证误差曲线;b)人工神经网络在测试集上预测最大功率密度的准确度表现;c)16种机器学习算法在网格搜索优化最佳超参数组合后在预测最大功率密度时的性能表现对比
图5.
训练后的人工神经网络对于测试集中极化曲线的预测与实际实验数据对比图
来源:“科学材料站”微信公众号