全新“CRESt”平台,加速能源材料科学突破
机器学习模型可以通过预测和建议实验来加速新材料的发现。然而,目前大多数模型只考虑少数特定的数据类型或变量。相比之下,人类科学家在一个协作环境中工作,他们会综合考虑实验结果、广泛的科学文献、成像和结构分析、个人经验或直觉,以及同事和同行评审者的意见。
现在,麻省理工学院(MIT)的研究人员开发了一种优化材料配方和规划实验的方法,该方法整合了来自文献见解、化学成分、微观结构图像等多种来源的信息。该方法是名为“真实世界实验科学家的副驾驶”(Copilot for Real-world Experimental Scientists,简称 CRESt)的新平台的一部分。该平台还利用机器人设备进行高通量材料测试,测试结果被反馈给大型多模态模型,以进一步优化材料配方。
研究人员可以与该系统进行自然语言对话,无需编写代码,系统会在整个过程中自行观察并提出假设。摄像头和视觉语言模型还允许系统监控实验、检测问题并建议纠正措施。
“在科学AI领域,关键在于设计新颖的实验,”工程学Carl Richard Soderberg教授、多模态AI研究的负责人Ju Li表示。“我们使用多模态反馈——例如先前文献中关于钯在特定温度下在燃料电池中表现的信息,以及人类反馈——来补充实验数据并设计新实验。我们还利用机器人来合成和表征材料结构,并测试其性能。”
该系统发表在《自然》杂志上。研究人员使用 CRESt 探索了 900 多种化学物质并进行了 3,500 次电化学测试,成功发现了一种催化剂材料,该材料在由甲酸盐产生电力的燃料电池中,实现了创纪录的功率密度。

CRESt 用户界面允许研究人员与平台对话,并指示它提供有前景的材料配方、启动样品制备或对 SEM 图像进行分析。
图片来源:MIT News;图表由研究人员提供;iStock
更智能的系统:告别传统局限
材料科学实验可能耗时且昂贵。它们需要研究人员仔细设计工作流程、制造新材料,并进行一系列测试和分析以了解结果,然后根据结果决定如何改进材料。
为了改进这一流程,一些研究人员转向了被称为“主动学习”(active learning)的机器学习策略,以有效利用先前实验数据点并探索或利用这些数据。当与一种称为贝叶斯优化(Bayesian optimization,BO)的统计技术结合使用时,主动学习已帮助研究人员找到了用于电池和先进半导体等应用的新材料。
“贝叶斯优化就像 Netflix 根据你的观看历史推荐下一部电影,只不过它推荐的是下一个要做的实验,”李解释道。“但基础的贝叶斯优化过于简单化了。它使用一个有界的设计空间,因此如果我说我要使用铂、钯和铁,它只在这个小空间内改变这些元素的比例。但真实材料有更多的依赖关系,BO 常常会迷失方向。”
大多数主动学习方法还依赖于单一数据流,这无法捕捉实验中发生的所有情况。为了使计算系统具备更像人类的知识,同时仍能利用自动化系统的速度和控制力,李和他的合作者开发了 CRESt。
CRESt 的机器人设备包括液体处理机器人、用于快速合成材料的碳热冲击系统、用于测试的自动化电化学工作站、包括自动化电子显微镜和光学显微镜在内的表征设备,以及可远程控制的辅助设备,如泵和气体阀门。许多处理参数也可以进行调整。
通过用户界面,研究人员可以与 CRESt 对话,并告诉它使用主动学习来寻找不同项目的有前景材料配方。CRESt 可以将其配方中包含多达 20 种前体分子和基底。为了指导材料设计,CRESt 的模型会搜索科学论文,寻找可能有用的元素或前体分子的描述。当人类研究人员指示 CRESt 追求新配方时,它会启动一个由样品制备、表征和测试组成的机器人交响乐。研究人员还可以要求 CRESt 对扫描电子显微镜成像、X 射线衍射和其他来源的图像进行分析。
来自这些过程的信息被用来训练主动学习模型,这些模型结合了文献知识和当前的实验结果来建议进一步的实验,从而加速材料发现。
李说:“对于每种配方,我们都会使用以前的文献文本或数据库,并在进行实验之前,根据先前的知识库为每种配方创建这些巨大的表示。我们在这个知识嵌入空间中进行主成分分析,以获得一个简化的搜索空间,该空间捕获了大部分性能变化。然后,我们在这个简化的空间中使用贝叶斯优化来设计新实验。在新实验之后,我们将新获得的模态实验数据和人类反馈输入到大型语言模型中,以扩充知识库并重新定义简化的搜索空间,这极大地提高了我们的主动学习效率。”
材料科学实验也可能面临重现性挑战。为解决这个问题,CRESt 通过摄像头监控实验,寻找潜在问题,并通过文本和语音向研究人员提出解决方案。
研究人员利用 CRESt 为一种先进的高密度燃料电池——直接甲酸盐燃料电池——开发了一种电极材料。在三个月内探索了 900 多种化学物质后,CRESt 发现了一种由八种元素组成的催化剂材料,与昂贵的贵金属钯相比,其单位成本的功率密度提高了 9.3 倍。在进一步的测试中,CREST 的材料被用于在工作的直接甲酸盐燃料电池中实现了创纪录的功率密度,尽管该电池中使用的贵金属量仅为先前设备的四分之一。
这些结果显示了 CRESt 解决困扰材料科学和工程界数十年的现实世界能源问题的潜力。
“燃料电池催化剂的一个重大挑战是贵金属的使用,”张说。“对于燃料电池,研究人员使用了各种贵金属,如钯和铂。我们使用了一种多元素催化剂,它还包含许多其他廉价元素,以创造最佳的配位环境,以实现催化活性和抵抗一氧化碳和吸附的氢原子等中毒物种的能力。多年来,人们一直在寻找低成本的选择。该系统极大地加速了我们对这些催化剂的搜索。”
得力的助手:超越自动化
早期,较差的重现性成为一个主要问题,限制了研究人员将新的主动学习技术应用于实验数据集的能力。材料特性可能受到前驱物混合和加工方式的影响,任何微小的问题都可能微妙地改变实验条件,需要仔细检查才能纠正。
为了部分实现流程自动化,研究人员将计算机视觉和视觉语言模型与来自科学文献的领域知识相结合,使系统能够假设导致重现性差的原因并提出解决方案。例如,模型可以注意到样品形状存在毫米级的偏差,或者移液器将某些东西放错了位置。研究人员采纳了模型的一些建议,从而提高了实验的一致性,这表明模型已经可以成为很好的实验助手了。
研究人员指出,人类仍然执行了大部分的实验调试工作。
李说:“CREST 是人类研究人员的助手,而不是替代品。人类研究人员仍然是不可或缺的。事实上,我们使用自然语言,以便系统可以解释它正在做什么,并提出观察结果和假设。但这向着更灵活、‘自动驾驶’的实验室迈进了一步。”
评论区