📢 转载信息
原文链接:https://openai.com/index/gpt-5-lowers-protein-synthesis-cost
原文作者:OpenAI
2026 年 2 月 5 日
GPT-5 助力降低无细胞蛋白质合成成本
与 Ginkgo Bioworks 合作,我们创建了一个由 AI 驱动的自主实验室,并将蛋白质生产成本降低了 40%。
我们看到了 AI 在数学和物理等领域取得的快速进展,在这些领域,想法通常可以在不接触物理世界的情况下进行评估。生物学则不同。进展必须通过实验室来实现,科学家们在那里进行耗时费钱的实验。
这种情况开始改变了。前沿模型现在可以直接连接到实验室自动化设备,提出实验方案,大规模运行实验,从结果中学习,并决定下一步行动。在生命科学的大部分领域,瓶颈在于迭代,而自主实验室就是为了消除这一限制而构建的。
在早期的工作中,我们展示了 GPT‑5 能够通过闭环实验改进湿法实验室方案。在这里,我们展示了相同的方法可以降低蛋白质生产成本。
我们与 Ginkgo Bioworks 合作,将 GPT‑5 连接到一个云实验室——一个通过软件远程运行的自动化湿法实验室,其中机器人执行实验并返回数据——并利用这个“实验室在环”的设置来优化一个广泛使用的生物过程:无细胞蛋白质合成(CFPS)。经过六轮闭环实验,该系统在 580 块自动化培养板上测试了超过 36,000 种独特的 CFPS 反应组合。在获得计算机、网页浏览器和相关论文的访问权限后,GPT‑5 仅用了三轮实验就确立了低成本 CFPS 的新最佳水平,实现了蛋白质生产成本降低 40%(试剂成本改善 57%),其中包括在自主实验室常见反应条件下更稳健的新型反应组合。
为什么无细胞蛋白质合成很重要
无细胞蛋白质合成 (CFPS) 是一种在不培养活细胞的情况下制造蛋白质的方法。CFPS 不是将 DNA 放入细胞中并等待它们产生蛋白质,而是在受控的混合物中运行蛋白质制造机制。这使其成为快速原型设计和测试的实用工具,因为科学家可以快速运行大量实验并在同一天测量结果。
蛋白质是现代生物学成果的重要组成部分。许多重要的药物都基于蛋白质。许多诊断和研究分析依赖于蛋白质。在工业环境中,蛋白质充当使化学过程更清洁、更高效的酶。蛋白质甚至存在于您的洗衣粉中。当蛋白质生产变得更快、更便宜时,科学家通常可以更快地测试更多想法,并降低将早期研究转化为人们日常受益成果的成本。
CFPS 已经对这种迭代很有用。瓶颈在于它很难优化,而且规模化时成本很高。
无细胞蛋白质合成难以优化且成本高昂
无细胞蛋白质合成需要复杂、相互作用的成分:编码待制造蛋白质的 DNA 模板、细胞裂解物(来自细胞内部的细胞机器“汤”)以及大量生化成分,范围从能源到盐类。整体上推理这个系统极其困难,许多先前的研究已经应用了不同类型的机器学习来降低蛋白质生产成本。
标准的无细胞蛋白质合成 (CFPS) 配方和商业试剂盒的定价通常是为人工作节奏设计的。自主实验室可以在人类团队运行几十个反应的时间内运行数千个反应。在这种规模下,试剂成本成为限制因素。
CFPS 单靠直觉也难以优化。它是由许多相互作用的成分组成的混合物。微小的变化可能很重要,但效果的方向并不总是很明显,而且在不进行大量实验的情况下很难找到最佳组合。先前的方法已经降低了成本,但进展往往是渐进的,因为彻底探索这个空间非常耗费人力。
将 GPT‑5 连接到机器人实验室
我们将 GPT‑5 与 Ginkgo Bioworks 的云实验室配对,形成了一个用于无细胞蛋白质合成 (CFPS) 优化的闭环自主系统。
GPT‑5 设计了一批实验。实验室执行了它们。结果被反馈给模型。模型利用这些数据来提出下一轮实验。
我们重复了这个循环六次。
GPT‑5 设计了一批标准 384 孔板格式的实验,并在 Ginkgo Bioworks 的云实验室上运行。实验结束后,云实验室将数据推回给 GPT‑5,模型分析结果,生成新假设,并设计下一轮实验。
为了使这个循环与自主实验室的能力保持一致,我们在任何实验运行之前增加了严格的程序验证。该验证确保了 AI 设计的实验可以在自动化平台上物理执行。它防止了在文本中看起来合理但无法在机器人工作流程中执行的“纸上实验”。
在整个运行过程中,该系统在 580 块自动化培养板上执行了超过 36,000 次 CFPS 反应。规模至关重要,因为它能让模式浮现出来。在生物学中,单个实验是有噪声的。高通量和迭代是区分信号和随机噪声的方法。一旦 GPT‑5 获得了相关论文和工具的访问权限,它用了三轮实验和两个月的时间就确立了新的最佳水平:与先前最佳基线相比,蛋白质生产成本降低了 40%。
Ginkgo Bioworks 的可重构自动化小车。图片来源:Ginkgo Bioworks
我们学到了什么
我们发现,改进来自于识别出那些相互配合良好并且能够在高通量自动化现实中保持稳定的组合。
我们发现 GPT‑5 确定了人类以前未在此配置中测试过的低成本反应组合。无细胞蛋白质合成 (CFPS) 已被研究多年,但可能混合物的空间仍然很大。当你能快速提出并执行数千种组合时,你可以找到手动工作流程容易错过的可行区域。
我们还发现,高通量、基于培养板的实验通常与手动、台式实验有所不同。氧合可能在不同的高通量反应格式中较低。混合和几何形状可能不同。事实上,由于较大规模通常伴随着更高的氧气可用性和更好的混合,试管中 CFPS 反应产生的蛋白质通常比微孔板中多得多。实际上,对于低体积的板式反应,GPT‑5 在获得用于数据分析的计算机和用于搜索相关论文的网页浏览器后,立即提出了一些优于先前最佳水平的反应组合。总的来说,GPT‑5 提出了许多在高通量约束下表现良好的试剂组合,其中包括许多在自动化实验室环境中常见的低氧条件下更稳定的组合。
此外,我们发现缓冲液、能量再生成分和多胺的微小变化相对于其成本具有不成比例的巨大影响。这些不总是人们首先关注的参数,但在高通量下,它们成为了可检验的假设,而不是背景假设。
最后,成本结构本身决定了哪些因素最重要。在 CFPS 中,成本现在主要由裂解物和 DNA 决定。这意味着产量是最高杠杆的策略。如果你能提高每单位昂贵投入的蛋白质产出,即使在追求其他方面的边际节省之前,你也能在成本上取得有意义的进展。
自主实验室迭代降低成本同时提高蛋白质产量
在六轮自主实验中,该系统稳步改进了无细胞蛋白质合成,在提高蛋白质产量的同时降低了成本。结果显示了每轮实验的反应成本与蛋白质滴度的关系,最佳权衡形成了前沿。较大的点标记了每轮实验中实现的最低单位克成本,星号/虚线参考点表示 384 孔板中先前的最佳水平基准(Olsen 等人,2025 年)。对后期轮次的仔细观察突出了最终的收益,逐轮总结显示了单位克成本随时间降低。
局限性
这些结果是在一种蛋白质 sfGFP 和一种无细胞蛋白质合成 (CFPS) 系统上演示的。需要进一步证明其对其他蛋白质和其他 CFPS 系统的泛化能力。
氧合和反应几何形状可能会强烈影响产率,这些因素在不同规模下可能会有所不同。一些改进可能对这些条件敏感,理解这些敏感性是下一步要解决的问题。
协议改进和试剂处理仍需要人工监督。该系统可以设计和解释实验,但实验室工作仍然涉及需要经验丰富的操作员处理的实际细节。
下一步是什么
我们计划将“实验室在环”优化应用于其他生物工作流程,在这些流程中,更快的迭代可以解锁进展。我们认为自主实验室与模型是互补的。模型可以生成设计,但归根结底,生物学仍然需要测试和迭代。将生成和实验之间的循环闭合是您将有前景的想法转化为可行结果的方式。
在我们致力于安全负责任地加速科学进展的同时,我们也寻求评估和减少风险,特别是与生物安全相关的风险。这些结果表明模型可以在湿法实验室中进行推理以改进方案,这可能对生物安全产生影响,我们会通过我们的准备框架进行评估和缓解。我们致力于在模型和系统层面建立必要且细致的保障措施以降低这些风险,并开发评估方法来跟踪当前水平。
我们感谢 Ginkgo Bioworks 的合作伙伴以及协助设计、运行和支持这项工作背后自动化云实验室的团队。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区