📢 转载信息
原文作者:David Rotman
位于马萨诸塞州剑桥的Lila Sciences公司里的微波炉大小的仪器,在我见过的其他尖端材料实验室的仪器中看起来并无太大不同。在其真空室内部,机器通过电击一系列不同的元素来产生汽化颗粒,这些颗粒随后穿过腔室,通过一种称为“溅射”的技术沉积下来形成薄膜。这台仪器与众不同之处在于,人工智能正在运行实验;一个经过海量科学文献和数据训练的AI代理(agent),已经确定了配方并正在改变元素的组合。
稍后,工作人员会将每个包含多种潜在催化剂的样品拿到实验室另一个区域进行测试。另一个AI代理将扫描并解释这些数据,利用这些信息提出另一轮实验建议,以期优化材料的性能。
本文是《麻省理工科技评论》“过度炒作纠偏”系列文章的一部分,该系列旨在重新设定人们对人工智能是什么、它能带来什么以及我们接下来的方向的期望。
目前,人类科学家仍在密切关注实验,并根据人工智能的建议和测试结果批准后续步骤。但这家初创公司坚信,这个由AI控制的机器是材料发现未来的缩影——一个由自主实验室使开发新颖且有用的化合物变得更便宜、更快捷的未来。
Lila Sciences获得了数亿美元的新资金注入,是人工智能领域最新的独角兽公司之一。该公司的宏大目标是利用人工智能运行的自主实验室进行科学发现——目标是实现其所称的“科学超级智能”。但我今天来这里,是想专门了解新材料的发现。
我们迫切需要更好的材料来解决我们的问题。我们需要用于更强大电池的改进电极和其他部件;用于更经济地从空气中捕获二氧化碳的化合物;以及用于生产绿色氢气和其他清洁燃料和化学品的更好催化剂。我们很可能还需要新颖的材料,例如更高温度的超导体、改进的磁体和不同类型的半导体,以推动从量子计算到聚变能再到AI硬件等各个领域的下一代突破。
然而,过去几十年里,材料科学在商业上鲜有斩获。部分原因是其复杂性和缺乏成功案例,该领域已成为一个创新的“荒地”,被更具魅力(和利润丰厚)的新药和生物学研究领域所掩盖。
使用人工智能进行材料发现的想法并非全新,但在2020年DeepMind展示了其AlphaFold2模型能够准确预测蛋白质三维结构后,该领域获得了巨大的推动力。接着,2022年,ChatGPT横空出世并大获成功。科技圈的内部人士对利用深度学习的类似AI模型辅助科学研究的希望高涨。何不利用我们新的生成式AI能力来探索广阔的化学空间,并帮助模拟原子结构,从而指明通往具有惊人特性的新物质的道路呢?
“模拟在构建问题框架和理解实验中哪些值得测试方面非常强大。但仅靠模拟,我们永远无法解决现实世界中的任何问题。”
John Gregoire, Lila Sciences, 首席自主科学官
研究人员吹捧一个据称发现了“数百万种新材料”的AI模型。资金开始涌入,资助了一大批初创公司。但迄今为止,还没有出现“尤里卡”时刻,没有出现类似ChatGPT那样的突破——即发现新的奇迹材料,甚至是性能略好一些的材料。
想要发现有用新化合物的初创公司面临一个共同的瓶颈:迄今为止,材料发现中最耗时和最昂贵的一步不是想象新结构,而是在现实世界中制造它们。在尝试合成材料之前,你不知道它是否真的可以制造出来并且稳定,而且在实验室测试之前,它的许多性能仍然未知。
Lila Sciences的首席自主科学官John Gregoire说:“模拟在构建问题框架和理解实验中哪些值得测试方面非常强大。但仅靠模拟,我们永远无法解决现实世界中的任何问题。”
像Lila Sciences这样的初创公司将策略押注在利用人工智能来变革实验上,他们正在构建利用AI代理来规划、运行和解释实验结果以合成新材料的实验室。实验室自动化早已存在。但这里的想法是让AI代理更进一步,指导自主实验室,其任务可能包括设计实验和控制用于转移样品的机器人技术。最重要的是,公司希望利用人工智能来吸收和分析此类实验产生的海量数据,以寻找更好材料的线索。
如果他们成功了,这些公司可以将发现过程从几十年缩短到几年甚至更短,帮助发现新材料并优化现有材料。但这需要一场赌博。尽管人工智能已经在接管许多实验室杂务和任务,但要让它独立发现新的——且有用的——材料,则是另一回事了。
创新荒地
我报道材料发现领域已有近40年,坦白地说,在此期间鲜有令人难忘的商业突破,比如锂离子电池。有很多科学进展值得报道,从钙钛矿太阳能电池到石墨烯晶体管,再到金属有机框架(MOFs)——这是一种基于迷人分子结构类型,其发明者最近获得了诺贝尔奖的材料。但很少有这些进展(包括MOFs)能走出实验室太远。其他材料,如量子点,找到了一些商业用途,但总的来说,过去几十年中创造的那种改变生活的发明却有所欠缺。
可以将此归咎于制造、测试、优化和制造新材料所需的时间(通常需要20年或更久)和数亿美元的成本——以及该行业对在低利润率的商品市场投入如此时间和金钱的兴趣缺乏。或者,也许我们只是用尽了制造新东西的想法。
加速这一过程和寻找新想法的需要,是研究人员转向人工智能的原因。几十年来,科学家一直使用计算机来设计潜在材料,计算原子放置在哪里才能形成稳定且具有可预测特性的结构。这很有效——但只是“某种程度上”有效。人工智能的进步使得这种计算建模变得快得多,并有望快速探索海量的潜在结构。谷歌DeepMind、Meta和微软都已启动工作,为新材料设计问题带来AI工具。
但是,长期以来困扰计算建模新材料的局限性依然存在。对于许多类型的材料,如晶体,有用的特性往往不能仅通过计算原子结构来预测。
要揭示和优化这些特性,你就需要制造出真实的东西。正如Lila联合创始人兼麻省理工学院材料科学教授Rafael Gómez-Bombarelli所言:“结构有助于我们思考问题,但对于真正的材料问题来说,它既非必要也非充分条件。”
也许没有哪项进展比DeepMind在2023年底宣布使用深度学习发现了“数百万种新材料”更能体现虚拟世界与物理世界之间的差距了,其中包括38万种他们宣布为“最稳定、有望成为实验合成的候选材料”的晶体。
对于人工智能界来说,这似乎是大家期待已久的突破。DeepMind的研究不仅提供了一个潜在新材料的金矿,还创造了用于预测大量结构的新型强大计算方法。
但一些材料科学家却有截然不同的反应。经过仔细审查后,加州大学圣巴巴拉分校的研究人员发现DeepMind发现的化合物“新颖性、可信度和实用性三项指标几乎没有证据”。事实上,这些科学家报告说,他们在检查的化合物中没有发现任何真正新颖的化合物;有些只是已知化合物的“微不足道的”变体。这些科学家似乎特别恼火的是,这些潜在化合物被标记为“材料”。他们写道:“我们恭敬地建议,这项工作并未报告任何新材料,而是报告了一份建议化合物的清单。在我们看来,只有当一种化合物表现出某种功能并具有潜在用途时,才能称之为材料。”
一些想象中的晶体根本不符合现实世界的条件。为了对如此多的潜在结构进行计算,DeepMind的研究人员在绝对零度下模拟它们,此时原子排列整齐;它们会轻微振动,但不会移动。在较高温度下——实验室或世界任何地方存在的温度——原子会以复杂的方式四处移动,通常会产生更无序的晶体结构。DeepMind预测的许多所谓的“新材料”似乎是已知无序材料的有序版本。
更普遍地说,DeepMind的论文只是再次提醒人们,将物理现实捕捉到虚拟模拟中是多么具有挑战性——至少目前是这样。由于计算能力的限制,研究人员通常只对相对较少的原子进行计算。然而,许多理想的特性是由材料的微观结构决定的——这个尺度远大于原子世界。而一些效应,如高温超导性,甚至是许多常见工业过程中关键的催化作用,其复杂性或人们的理解程度太低,无法仅通过原子模拟来解释。
共同的语言
即便如此,仍有迹象表明模拟与实验工作之间的鸿沟正在开始缩小。例如,DeepMind表示,自2023年论文发布以来,他们一直在与世界各地的科学家合作,合成人工智能识别的化合物,并取得了一些成功。与此同时,许多进入该领域的新兴初创公司正试图将计算和实验专业知识结合到同一个组织中。
Periodic Labs就是这样一家初创公司,由Ekin Dogus Cubuk(一位领导了2023年DeepMind轰动性报道的科学团队的物理学家)和Liam Fedus(OpenAI ChatGPT的联合创造者之一)共同创立。尽管其创始人拥有计算建模和人工智能软件背景,但该公司正围绕自动化实验室的合成来构建其大部分材料发现战略。
这家初创公司的愿景是通过使用接受科学文献训练并能够从持续实验中学习的大型语言模型(LLM)来连接这些不同的专业领域。一个LLM可能会建议制造化合物的配方和条件;它还可以解释测试数据,并向初创公司的化学家和物理学家提供更多建议。在这种策略中,模拟可能会提出潜在的材料候选者,但它们也用于帮助解释实验结果并建议可能的结构调整。
宏伟的目标将是室温超导体,这是一种可以彻底改变计算和电力,但却让科学家们望而却步了几十年的材料。
Periodic Labs和Lila Sciences一样,其抱负不仅仅是设计和制造新材料。它希望“创造一个AI科学家”——一个特别擅长物理科学的科学家。“LLM在提炼化学信息、物理信息方面已经相当出色,”Cubuk说,“现在我们正试图通过教它如何做科学——例如,进行模拟、进行实验、进行理论建模——来使其更加先进。”
这种方法,与Lila Sciences的方法类似,是基于这样一种期望:对材料及其合成背后的科学有更好的理解,将产生有助于研究人员发现广泛新材料的线索。Periodic Labs的目标之一是那些其特性由量子效应定义的材料,例如新型磁体。宏伟的目标将是室温超导体,这是一种可以彻底改变计算和电力,但却让科学家们望而却步了几十年的材料。
超导体是电流无电阻流过且不产生热量的材料。到目前为止,最好的此类材料仅在相对较低的温度下才表现出超导性,并且需要大量的冷却。如果它们能在接近室温或室温下工作,它们可能会带来效率更高的电网、新型量子计算机,甚至更实用的磁悬浮高速列车。
未能发现室温超导体是过去几十年材料科学中的一大失望。里根总统在1987年谈论这项技术时我当时在场,那是在新制成的陶瓷(在相对宜人的93开尔文(即−292°F)温度下表现出超导性)达到炒作高峰的时候,他对它们“将我们带入一个新时代的门槛”表示兴奋。里根总统在华盛顿希尔顿酒店拥挤的宴会厅里,科学家和商界人士都充满了乐观情绪,他预言“这将带来一系列好处,其中最不重要的是减少对外国石油的依赖、更清洁的环境和更强大的国民经济。”回想起来,这可能是我们最后一次将经济和技术希望寄托于材料突破的时刻了。
承诺的新时代从未到来。科学家们至今仍未找到在正常条件下能在室温或接近室温下表现出超导性的材料。目前最好的超导体都很脆,并且往往难以用作电线。
发现更高温度超导体如此困难的原因之一是,没有理论可以解释相对高温下的效应——或者仅仅通过原子在结构中的排列来预测它。最终将需要由实验室科学家来合成任何有趣的候选材料,对其进行测试,并搜索由此产生的数据,以寻找理解这个仍然令人费解的现象的线索。Cubuk说,这是Periodic Labs的优先任务之一。
人工智能负责
研究人员首次制造出晶体结构可能需要一年或更长时间。然后,通常还需要进一步的工作来测试其特性并确定如何制造商业产品所需的更大数量。
像Lila Sciences和Periodic Labs这样的初创公司将希望主要寄托于AI指导的实验可以大幅缩短这些时间。乐观的原因之一是,许多实验室已经整合了大量的自动化,涵盖了从准备样品到在测试项目之间转移的所有环节。研究人员经常使用机械臂、软件、自动化显微镜和其他分析仪器,以及用于操作实验室设备的机械化工具。
自动化实现了高通量合成等功能,即快速创建和筛选具有各种成分组合的多个样品,从而大大加快了实验速度。
这里的想法是,利用人工智能来规划和运行这种自动化合成,可以使其更具系统性和效率。AI代理可以收集和分析比任何人类都多的数据,它们可以利用实时信息来改变成分和合成条件,直到获得具有最佳性能的样品。这种AI指导的实验室可以比人进行更多的实验,并且可能比现有的高通量合成系统更智能。
但是,所谓的材料自驾实验室仍处于开发阶段。
许多类型的材料需要固态合成,这是一系列比液体处理过程更难自动化的过程,而液体处理在制造药物方面很常见。你需要按照正确的组合准备和混合多种无机成分的粉末,以制造出催化剂,然后决定如何处理样品以产生所需的结构——例如,确定进行合成所需的正确温度和压力。即使是确定你制造了什么也可能很棘手。
2023年,劳伦斯伯克利国家实验室的A-Lab声称是第一个使用无机粉末作为起始原料的全自动化实验室。随后,科学家们报告说,该自主实验室利用机器人技术和人工智能合成并测试了41种新材料,其中包括DeepMind数据库中预测的一些材料。一些批评者质疑所生产材料的新颖性,并抱怨对材料的自动化分析未达到实验标准,但伯克利的研究人员为这项工作辩护,称其仅仅是证明自主系统的潜力。
A-Lab的首席科学家Gerbrand Ceder说:“它的工作方式与我们设想的仍然有所不同。还有很多工具构建工作需要完成。”
AI代理已经在做许多实验室杂务方面变得很擅长,从准备配方到解释某些类型的测试数据——例如,在显微照片中发现人眼可能看不到的模式。但Ceder希望这项技术能很快“捕捉到人类的决策制定能力”,分析正在进行的实验以对下一步行动做出战略选择。例如,他的团队正在开发一种改进的合成代理,该代理将更好地整合他所称的科学家的“扩散”知识——即从广泛培训和经验中获得的知识。“我设想一个世界,人们围绕自己的专业知识构建代理,然后有一个‘超级模型’将它们组合起来,”他说。“这个超级模型基本上需要知道它可以调用哪些代理以及它们知道什么,或者它们的专业知识是什么。”
“在我工作的一个领域,固态电池,每天都有50篇论文发表。而那只是我工作的一个领域。人工智能革命的意义在于,我们终于可以收集我们所拥有的所有科学数据了。”
Gerbrand Ceder, A-Lab首席科学家
AI代理的一个优势在于它们吞噬海量科学文献的能力。Ceder说:“在我工作的一个领域,固态电池,每天都有50篇论文发表。而那只是我工作的一个领域。‘人工智能革命的意义在于,我们终于可以收集我们所拥有的所有科学数据了。’”任何人都不可能跟上。
去年夏天,Ceder成为一家名为Radical AI的人工智能材料发现初创公司首席科学官,并从加州大学伯克利分校休假,协助其在纽约市建立自驾实验室。一张幻灯片展示了旨在实现Ceder愿景的各种AI代理和生成模型的组合。如果你仔细观察,你会发现一个被称为“编排者”(orchestrator)的LLM——这是CEO Joseph Krause称之为“总管”(head honcho)的模型。
新的希望
到目前为止,尽管人工智能在发现新材料方面备受炒作,并且该领域势头(和资金)日益增强,但仍未出现令人信服的重大胜利。没有出现像2016年DeepMind的AlphaGo击败围棋世界冠军那样的例子。也没有出现像AlphaFold在掌握生物医学中最困难、最耗时的任务之一——预测蛋白质3D结构那样的成就。
材料发现领域仍在等待它的时刻。如果AI代理能够像我们今天所拥有的那样,但做得更好,从而极大地加速实用材料的设计或合成,那么这个时刻可能会到来。或者,也许这个时刻将是发现一个真正新颖的材料,比如室温超导体。
无论是否有这样的突破时刻,初创公司都面临着将科学成就转化为有用材料的挑战。这项任务尤其困难,因为任何新材料很可能需要在由不愿冒险的大型现有公司主导的行业中实现商业化。
技术投资者、风险投资公司SOSV的合伙人Susan Schofer对该领域持谨慎乐观态度。但Schofer曾在21世纪初花了几年时间在最早使用自动化和高通量筛选进行材料发现的初创公司之一担任催化剂研究员(该公司未能存活下来),她希望在评估初创公司进行投资时,看到该技术转化为商业成功的证据。
特别是,她希望看到证据表明,AI初创公司“正在发现一些新的、不同的东西,并且知道如何在此基础上进行迭代。”她还希望看到一个能够捕捉新材料价值的商业模式。她说:“我认为理想情况是:我从行业那里得到了一份规格。我知道他们的问题是什么。我们已经定义了它。现在我们要去建造它。现在我们有了一种可以销售的新材料,我们已经将其扩大到足以证明其可行性。然后我们通过某种方式与他人合作进行制造,但我们通过销售材料获得收入。”
Schofer表示,虽然她理解重新定义科学的愿景,但她会建议初创公司“向我们展示你将如何实现这一目标。”她补充说,“让我们看看第一步。”
展示这些第一步对于吸引大型现有材料公司更充分地采用人工智能技术至关重要。行业内的企业研究人员过去曾多次受挫——几十年来,人们一直承诺越来越强大的计算机将神奇地设计出新材料;21世纪初席卷材料研发实验室但鲜有实质性成果的组合化学热潮;以及合成生物学将创造我们下一代化学品和材料的承诺。
最近,材料界笼罩在围绕人工智能的新一轮炒作周期中。其中一些炒作是由2023年DeepMind宣布发现“数百万种新材料”的声明所推动的,但回顾来看,这个声明显然夸大了。随后,一名麻省理工学院经济学学生在2024年末发表的一篇论文进一步助长了这种炒作,该论文声称一个大型、未具名的企业研发实验室利用人工智能高效地发明了一系列新材料。人工智能似乎已经彻底改变了这个行业。
几个月后,麻省理工学院经济学系得出结论,认为“该论文应从公开讨论中撤回”。论文脚注中致谢的两名著名麻省理工学院经济学家表示,他们对“数据的来源、可靠性或有效性以及研究的真实性”没有信心。
人工智能能否超越炒作和虚假的希望,真正改变材料的发现过程?也许吧。有充分的证据表明,它正在改变材料科学家的工作方式,至少为他们提供了有用的实验室工具。研究人员越来越多地使用LLM来查询科学文献,并在实验数据中发现模式。
但将这些人工智能工具转化为实际的材料发现成果,仍处于早期阶段。特别是人工智能在运行自主实验室方面的应用才刚刚开始...
评论区