2023-04-25 17:28  记者:张璐    编辑:陈静

“研究初期有人质疑我说,人家是做颠覆性技术,你是颠覆同事。其实不是这样的。”江俊说,一个好的工具会带来很多可能性,科研人员会借此发现更多理论。

在中国科学技术大学的机器化学家实验室,200公斤的机器人“小来”正有条不紊地穿梭在各个操作台前。它不仅可以听从科研人员的输入指令,用机械手臂配制试剂,还能自己阅读文献,进行化学品开发。

这款全球首个集阅读文献、设计实验、自主优化、覆盖化学品开发全流程的机器化学家平台被形象地称为“机器化学家”,由中国科学技术大学化学物理系教授江俊团队开发。这位可以用精准智能新范式创制化学品的“机器化学家”是如何“炼成”的?近日,新京报记者来到中国科大进行实地探访。

在中国科学技术大学的机器化学家实验室,200公斤的机器人“小来”正有条不紊地穿梭在各个操作台前

做实验。  新京报记者 张璐 摄

1400年变5周,化学品创制周期极大缩短

化学是一门重要的基础学科。传统化学研究范式深度依赖于“试错法”,其局限性使得新物质创制的周期长、成本高。1998年,诺贝尔化学奖授予两位量子化学家,他们用量子力学揭示了化学本质规律,将化学带入新的时代。

江俊说,尽管对物理化学问题做数学求解的基本规则已经清楚,但由于真实的化学体系非常复杂,算力和人类思考能力有限,理论和实践常常处于“脱节”状态。

随着人工智能的快速发展,一种新的研究范式在科研人员脑中逐步清晰。“如果我们能够把化学知识、物理知识、底层知识数据化、代码化、迁移化,就有可能形成智能化的新研究范式。”面对缺乏高质量数据的难题,团队想出了一个新思路——用理论模拟大数据产生预训练模型,再依托应用实践小数据做校正,建立面向复杂体系的“理实交融”模型。

2014年,江俊带领一支涵盖化学、计算机、数学的跨学科团队提出“机器化学家”的概念——“机器化学家”首先要“能学”,即模型漫无目的地学习化学知识,阅读海量文献;同时要“能想”,即调用底层的物理模型进行思考和模拟计算;最终是要“能做”,即完成实验,实现科学方法的闭环。

历经8年时间,江俊团队成功打造了中国科大的机器化学家“小来”,研究成果论文于去年10月在《国家科学评论》学术期刊发表。

“时下很热的ChatGPT是文科生,它的答案是开放性的,而‘机器化学家’是理科生,只会通过阅读文献学习知识并给出正确答案,且经过机器实验验证。”江俊说。

他用创制“高熵非贵金属产氧催化剂”举例,展示“机器化学家”的“精准化”。高熵材料具有高混乱、高无序、高复杂度的特点,它能够提高能源电池的稳定性,对新能源产业来说很重要。按照以往的方法,科研人员要从29种非贵金属元素中选出5种,进行超过55万种配比组合,研究“试错”需要1400年。

而“机器化学家”通过阅读1.6万篇催化论文,可以“大胆假设”,自主遴选出5种非贵金属元素,通过机器精准实验“小心求证”,并融合2.5万组理论计算数据和207组全流程机器实验数据,建立并优化预测模型,将创制周期缩短为5周。

近期,科技部会同自然科学基金委启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,紧密结合数学、物理、化学、天文等基础学科关键问题,布局“人工智能驱动的科学研究”前沿科技研发体系。

“第四次科技革命的驱动力,必然是机器智能,其途径将是AI for Science。”江俊说,中国科大的AI for Science不仅赋予了机器人以科学思维,还可以将其大范围迁移应用。人类化学家的培养需要经过阅读学习、掌握理论、实践操作、思考推演等漫长的科学训练,难以从一个人迁移到另一个人。但“机器化学家”可以进行海量阅读、多维思考、精准操作、快速迭代,迁移仅需代码复制,方便“科学家”的批量生产。

据他介绍,化学实验指令集与模板库承载化学思维的大规模迁移,可以助力半导体器件与芯片、高分子材料等多种领域的精准创制。

“小来”又稳又准,一天可进行2000次操作

在机器化学家实验室的大屏幕上,一个复杂实验的流程已经被设定好,液体进样站、磁力搅拌站、烘干工作站等工作站像搭积木一样,被一一连接起来。机器化学家“小来”按照这些设定好的流程,稳稳当当地来到各个工作站前,使用机械臂抓取试管,操控不同实验工作站进行液体称量、搅拌、离心、烘干……

这个实验的任务是进行芬顿催化剂配方的优化。江俊简单地概括了这一过程——“小来”把不同的金属醋酸盐溶液注入瓶子中,通过磁力搅拌充分反应,进行不同配比的芬顿催化剂创制,并使用荧光光谱测试其催化活性。每做完一次实验,数据结果都会自动归档,累积到一定程度后进行自动分析。

人工做单个实验比“小来”快,但“小来”的优势是操作精准、误差小。“人类的双手已经跟不上机器的进化速度,机器自动化环节几乎可以实现零故障。”他说,机器人还可以24小时不休息,每天完成2000次操作,而科研人员每天只能做三四百次。

实验室里的很多仪器,也是专门为“小来”定制的。

液体进样仪由中国科大自主研发,江俊说,此前团队想购买进口仪器,但公司不向团队开放API,所以仪器无法和机器人互联实现智能化,另外,进口仪器只能单通道进样。于是,中国科大自动化系的老师和化学物理系的学生自主研发仪器,用3D打印建模制作针头,实现了十个通道的高精度进样,每个通道进样的精度是0.1毫克。“进样精度相比市场上的液体进样仪是最高的,十个通道也是最多的。”

有些化学品的合成过程需要将多余的液体烘干。然而科研人员发现,机器人的手臂无法将样品架塞到烘干机中。后来大家想办法对烘干机进行改造,使其可以像洗碗机一样将托盘弹出。

据江俊介绍,实验还有一个步骤,“小来”需要将催化剂滴到测试碳纸上,碳纸的厚度只有0.1毫米,科研人员用手抓取都可能会断裂,为了让机械臂顺利工作,他们使用机械臂配合真空气动吸爪,顺利将碳纸吸了起来。

目前,“小来”主要在科研人员的监控下进行操作。“小来”可以记录操作日志,从而学习人类的操作逻辑。和以往不同,机器还可以记录大量的失败实验数据并进行溯源,避免重复试错。未来,团队计划建立报警机制和安全体系,应对可能出现的断水、断电等突发情况。

值得一提的是,“小来”不仅不知疲倦,解放了科研人员的双手,本身也足够聪明。目前,多个科研机构人员已经在实验室做过实验,每做一个实验就会留下模板,未来模板越积累越多,学生再做实验只需要调用模板即可,不用再一次次地试错。未来,机器人还将实现预判实验、自主思考、做出智能决策。

多学科交叉,团队青年“跨界”学知识

创造出“小来”这样一位“机器化学家”并非易事。

英国利物浦大学安德鲁·库珀(Andrew Cooper)曾为“小来”点赞,称它是具备科学思维的“机器化学家”。2020年,他的团队也研制出了世界首个机器人化学实验员。“差别和优势在于,我们实现了‘化学大脑’,有思考才有预见,有预见才能创造新材料,跳出了经验主义的陷阱,实现全流程智能化的闭环。”江俊说。

使“机器化学家”具备科学思维,得益于中科院建制化的优势和中国科大多学科交叉的背景。

江俊坦言,国外科学家也有想法和思路,但他们很难相互合作,因为大家非常关注科研隐私,无法做到数据共享。中科院有建制化的优势,可以把做理论模型、算法软件、机器人、化学数据等的专家集合在一起,共同把这样的构想变成现实。“我很感谢中科院,以前我们写申请书要四五十页纸,这次我就写了两页,没提我们有什么基础,只说我们的设想有多么伟大。”他凭着两页纸,申请到了2500万元的科研经费,为科研提供了充分保障。

中国科大交叉培养的模式,是创造新范式的前提条件。江俊团队有大量具备交叉学科背景的“90后”,有人设计软件架构,有人编写程序,有人主攻电化学测试,有人负责烘干仪器、光谱仪等硬件的驱动程序开发。

25岁的在读博士赵路远,目前在团队中负责操作系统调度算法的开发和化学仪器自动化算法的开发。“我本科学的是电子科学与技术。这个专业比较‘万金油’,硬件设计、软件开发、光谱等领域的知识我都有所了解。”她说,得到保研机会后,她进入江俊团队,进行人工智能与分子光谱的交叉研究。在她看来,以往学习的知识偏工科,现在要重新学习物理化学的底层理论知识颇具挑战,“但是学完这些理论,我在开发算法时会有更加透彻的理解,各方面能力也得到了提升。”

江俊还讲了一个小插曲,最初为了让机器读懂论文,有两届学生参与了“打标签”的工作,他们用专业知识区分数据的关联性,从海量的论文中将化学词汇挖掘出来,标注语义,让机器知道每个数据背后的物理意义,并对机器进行训练,生成了一个自然语言处理模型。

未来将赋予化学机器人“五官”

“机器化学家”是否会对主攻化学的科研人员造成冲击?

“研究初期有人质疑我说,人家是做颠覆性技术,你是颠覆同事。其实不是这样的。”江俊说,一个好的工具会带来很多可能性,科研人员会借此发现更多理论。他举例说,目前50%的化工能耗用在了分离提纯产物上,如果能精准控制、智能设计,不再产生副产物和污染,“绿色化学”才能真正实现。所以,好的工具会让科研人员“越来越忙”。

他认为,今后的化学人才要有扎实的基础,将专业知识学精,另外要有开放的心态,敢于学习新的知识。

谈及未来计划,江俊说,科研团队将赋予“小来”五官外形,让它看起来像真正的化学家一样,可以闻到化学品的气味,看到化学品的颜色,感知温度、湿度和压力。

江俊说,他们计划为机器人安装红外探头和拉曼探头,使其既有红外视觉又有可见光视觉。“人类肉眼只能看到大致宏观的现象,通过光谱,机器人可以把微观信息理解清楚,预测很多金属材料的催化活性。”

目前,第一代操作系统支持机器人同时做三个实验,对设备进行分时复用。未来的第二代系统可以容纳百个任务同时进行。他描述了未来“机器化学家”集中做实验的场景:在高新区的大型实验室中,有的机器人在地上跑,有的在空中漂浮,还有的在操作台前忙碌。

在更远的未来,上百个机器人日均可以完成百万级操作,上千个化学工作站可以覆盖所有化学功能。基于这个大平台,各个课题组的实验数据交汇、共享,可以产生海量数据,实现自动提炼出数字化的知识图谱和人工智能模型,进而指导机器人自动优化,产生更好性能、更高效率的化学品或新材料。

“届时,我们可以坐在咖啡厅,对着屏幕指挥机器人帮我们完成化学研究。”他表示,团队的终极目标是:未来有一天产生具备创造力的“机器化学家”,建立起数据与智能驱动的化学研究新范式。

新京报记者 张璐

编辑 陈静 校对 李立军

文章来源: https://www.bjnews.com.cn/detail/168240847714623.html