目 录CONTENT

文章目录

GPT-5 降低了无细胞蛋白合成成本

Administrator
2026-02-06 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/gpt-5-lowers-protein-synthesis-cost

原文作者:OpenAI


2026年2月5日

研究 GPT-5 降低了无细胞蛋白合成成本

我们与 Ginkgo Bioworks 合作,创建了一个由 AI 驱动的自主实验室,实现了 40% 的蛋白质生产成本降低。

我们已经看到了 AI 在数学和物理等领域取得了快速进展,在这些领域,想法通常可以在不接触物理世界的情况下进行评估。但生物学是不同的。进展是通过实验室实现的,科学家在那里进行耗时且昂贵的实验。

这种情况正在开始改变。前沿模型现在可以直接连接到实验室自动化设备,提出实验、大规模运行、从结果中学习,并决定下一步做什么。在生命科学的大部分领域,瓶颈在于迭代,而自主实验室就是为了消除这一限制而构建的。

在早期的工作中,我们证明了 GPT‑5 可以通过闭环实验改进湿实验方案。在这里,我们展示了同样的方法可以降低蛋白质生产的成本。

我们与 Ginkgo Bioworks 合作,将 GPT‑5 连接到一个云实验室——一个通过软件远程运行的自动化湿实验室,其中机器人执行实验并返回数据——并利用该“实验室闭环”设置来优化一个广泛使用的生物过程:无细胞蛋白合成 (CFPS)。经过六轮闭环实验,该系统在 580 个自动化板上测试了超过 36,000 种独特的 CFPS 反应成分。在获得计算机、网页浏览器以及相关论文的访问权限后,GPT‑5 仅用了三轮实验就确立了低成本 CFPS 的新技术水平,实现了 40% 的蛋白质生产成本降低(试剂成本降低了 57%),其中包括了在自主实验室常见反应条件下更具鲁棒性的新型反应成分。

为什么无细胞蛋白合成很重要

无细胞蛋白合成 (CFPS) 是一种无需培养活细胞即可制造蛋白质的方法。与将 DNA 放入细胞中并等待它们产生蛋白质不同,CFPS 在受控的混合物中运行蛋白质制造机制。这使其成为快速原型设计和测试的实用工具,因为科学家可以快速运行许多实验并在同一天测量结果。

蛋白质是现代生物学提供的许多重要组成部分。许多重要的药物都基于蛋白质。许多诊断和研究分析依赖于蛋白质。在工业环境中,蛋白质充当使化学过程更清洁、更高效的酶。蛋白质甚至存在于您的洗衣粉中。当蛋白质生产变得更快、更便宜时,科学家通常可以更快地测试更多的想法,并降低将早期研究转化为人们日常可以受益的事物的成本。

CFPS 已经对这种迭代有用。瓶颈在于它难以优化,而且在规模化时会变得昂贵

无细胞蛋白合成难以优化且成本高昂

无细胞蛋白合成需要复杂且相互作用的成分:编码待制造蛋白质的 DNA 模板、细胞裂解物(来自细胞内部的细胞机械“汤”),以及大量的生化成分,从能源到盐分不等。要对整个系统进行推理非常困难,并且许多以往研究已经应用了不同类型的机器学习来降低蛋白质生产成本。

标准的无细胞蛋白合成 (CFPS) 配方和商业试剂盒通常是为人工节奏的工作定价的。自主实验室可以在人类团队运行几十个反应的时间内运行数千个反应。在这个规模上,试剂成本成为了限制因素。

CFPS 也很难仅凭直觉进行优化。它是许多相互作用成分的混合物。微小的变化可能很重要,但影响的方向并不总是明显的,如果不进行大量实验,很难找到最佳组合。先前的方法已经降低了成本,但进展往往是渐进式的,因为彻底探索这个空间非常耗费人力。

将 GPT‑5 连接到机器人实验室

我们将 GPT‑5 与 Ginkgo Bioworks 的云实验室配对,形成了一个用于无细胞蛋白合成 (CFPS) 优化的闭环自主系统

GPT‑5 设计了实验批次。实验室执行了它们。结果被反馈给模型。模型利用这些数据来提出下一轮实验。我们重复了这个循环六次。

Diagram titled “AI-driven autonomous lab.” GPT-5 performs data analysis, biochemical reasoning, and hypothesis generation, sending experimental designs to Reconfigurable Automation Carts (RACs), which execute physical experiments, automate liquid handling, incubate samples, and measure fluorescence. RACs return experimental data and metrics back to GPT-5, forming a closed feedback loop.

GPT‑5 以标准的 384 孔板格式设计了实验批次,并在 Ginkgo Bioworks 的云实验室上运行它们。实验完成后,云实验室将数据推回 GPT‑5,模型在那里分析结果、生成新假设并设计下一轮实验。

为了使循环与自主实验室的能力保持一致,我们在任何实验运行之前添加了严格的程序验证。该验证确保了 AI 设计的实验可以在自动化平台上物理执行。它防止了那些在文本中看起来合理但无法在机器人工作流程中完成的“纸上实验”。

在整个运行过程中,该系统在 580 个自动化板上执行了超过 36,000 次 CFPS 反应。这个规模很重要,因为它能让模式浮现。在生物学中,单个实验是有噪声的。高通量和迭代是区分信号和随机噪声的方法。一旦 GPT‑5 获得了相关论文和工具的访问权限,它用了三轮实验和两个月的时间就确立了新的技术水平:与先前最佳基线相比,蛋白质生产成本降低了 40%。

Ginkgo Bioworks 的可重构自动化车。图片来源:Ginkgo Bioworks

我们学到了什么

我们发现,改进来自于识别协同作用好并且经得起高通量自动化现实检验的组合。

我们发现 GPT‑5 识别出了人类以前未以这种配置测试过的低成本反应成分。无细胞蛋白合成 (CFPS) 已经被研究多年,但可能混合物的空间仍然很大。当你能够快速提出并执行数千种组合时,你就可以找到在手动工作流程中容易错过的可行区域。

我们还发现,高通量、基于板的实验通常与手动、台式实验有所不同。氧合作用可能会在更高通量的反应格式中较低。混合和几何形状也可能不同。事实上,由于较大规模通常伴随着更多的氧气可用性和更好的混合,微孔板反应中蛋白质的产量通常比试管中的少得多。事实上,对于小体积的板载反应,GPT‑5 在获得用于数据分析的计算机和用于搜索相关论文的网页浏览器后,立即提出了许多优于先前最佳水平的反应。总的来说,GPT‑5 提出了许多在高通量限制下表现良好的试剂组合,包括许多在自动化实验室环境中常见的低氧条件下更具鲁棒性的组合。

此外,我们发现缓冲、能量再生成分和多胺的微小变化相对于其成本产生了不成比例的影响。这些不总是人们首先关注的参数,但在高通量下,它们成为可测试的假设,而不是背景假设。

最后,成本结构本身决定了什么重要。在 CFPS 中,成本现在主要由裂解物和 DNA 决定。这意味着产量杠杆率最高的策略。如果你能提高每单位昂贵投入的蛋白质产出,即使在追求其他方面的边际节省之前,你也能在成本上取得有意义的进展。

自主实验室迭代在提高蛋白质产量的同时降低了成本

在六轮自主实验中,该系统稳步改进了无细胞蛋白合成,在提高蛋白质产量的同时降低了成本。结果显示了每轮的反应成本与蛋白质效价(titer),其中最佳的权衡形成了前沿。较大的点标记了每轮中实现的最低每克成本,星号/虚线参考指示了 384 孔板中先前技术水平的基准(Olsen 等人,2025 年)。对后期轮次的仔细观察突出了最终的增益,而逐轮总结显示了最低每克成本随时间降低。

局限性

这些结果是在一种蛋白质 sfGFP 和一种无细胞蛋白合成 (CFPS) 系统上证明的。泛化到其他蛋白质和其他 CFPS 系统仍有待证明。

氧合作用和反应几何形状会强烈影响产率,这些因素在不同尺度上可能有所不同。一些改进可能对这些条件敏感,理解这些敏感性是下一步要解决的问题。

人类监督对于方案改进和试剂处理是必需的。该系统可以设计和解释实验,但实验室工作仍然涉及需要经验丰富的操作人员的实际细节。

接下来的步骤

我们计划将“实验室闭环优化”应用于其他生物工作流程,在这些流程中,更快的迭代可以释放进展。我们将自主实验室视为模型的补充。模型可以生成设计,但最终生物学仍然需要测试和迭代。在生成和实验之间闭合循环是将有希望的想法转化为实际结果的方法。

当我们致力于安全负责任地加速科学进展时,我们也寻求评估和降低风险,特别是与生物安全相关的风险。这些结果表明模型可以在湿实验室中进行推理以改进方案,并可能对生物安全产生影响,我们通过我们的准备框架对其进行评估和缓解。我们致力于在模型和系统层面建立必要和细致的保障措施以降低这些风险,以及开发评估当前水平的评估方法。

我们感谢 Ginkgo Bioworks 的合作伙伴以及帮助设计、运行和支持这项工作背后的自动化云实验室的团队。


🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区