目 录CONTENT

文章目录

利用 GPT-5 加速科学研究的早期实验

Administrator
2025-11-22 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/accelerating-science-gpt-5

原文作者:OpenAI


科学塑造着从人类健康到能源生产、从国家安全到我们对宇宙理解的一切。如果人工智能能够加速科学进程——缩短产生新想法的时间,或者将想法转化为经过检验的结果——那么这些益处将在整个社会中得到复利。

但是,创新的步伐仍然是一个限制因素。即使有了正确的想法,将其转化为产品或治疗方法也可能需要数年时间。在最近的一项调查中,60%的美国人认为科学和医学突破到达他们手中太慢;73%的人认为我们需要更好的发现加速方式;69%的人将科学领导力确定为国家优先事项。

今天,我们发布了由范德堡大学、加州大学伯克利分校、哥伦比亚大学、牛津大学、剑桥大学、劳伦斯利弗莫尔国家实验室和杰克逊实验室等大学和国家实验室的合作者共同撰写的《利用 GPT-5 加速科学的早期实验》。该论文汇集了数学、物理学、生物学、计算机科学、天文学和材料科学等领域的早期案例研究,其中 GPT-5 帮助研究人员以新颖的方式综合已知结果、进行强大的文献综述、加速棘手的计算,甚至为未解决的命题生成了新的证明。论文也记录了其局限性。我们的目标是让社区清楚地了解这些系统在当今研究环境中能够做什么、不能做什么。

这些案例研究表明,在专家手中,GPT-5 如何加速科学发现,以及这种加速为何重要:

  • 生物学:在一项由 Derya Unutmaz 博士领导的研究中,科学家们花了数月时间试图解释人类免疫细胞中一个令人困惑的变化。GPT-5 在几分钟内从一份未发表的图表中确定了可能的机制,并提出了一个证明该机制的实验。这种速度可以帮助研究人员更快地了解疾病并开发更好的疗法。
  • 数学:在另一个案例中,研究人员 Mehtaab Sawhney 和 Mark Sellke 正在攻克一个几十年前由 Paul Erdős 提出的悬而未决的问题。他们在最后一步遇到了困难,GPT-5 提出了一个关于一个奇数如何打破模式的新想法,帮助他们完成了证明。此类进展加强了许多算法和安全技术最终依赖的数学基础。
  • 算法与优化:研究人员 Sébastien Bubeck 和 Christian Coester 正在测试机器人技术和路由中常用的决策方法是否像人们假设的那样可靠。GPT-5 找到了一个新的、清晰的例子,表明该方法可能会失败,并改进了优化中的一个经典结果(优化是找出解决问题最佳方式所用的数学)。这类进展有助于工程师更好地理解机器人技术、路由和其他实际应用中使用的决策系统。
A collage-style graphic featuring abstract shapes and colors. The top left shows a muted orange block with partially visible text. The top right contains a branching diagram with thin black arrows diverging from a central black dot, along with small orange circles marking different points. The bottom left displays a soft blend of orange, pink, and purple gradients. The bottom right features a large black number “5” on a light blue background.

什么是 OpenAI for Science?

OpenAI for Science 的使命是加速科学发现:帮助研究人员探索更多想法、更快地检验假设,并揭示那些原本需要大量时间才能发现的见解。我们通过将前沿模型与正确的工具、工作流程和协作相结合来实现这一目标。

我们与学术界、工业界和国家实验室的研究人员密切合作。这些合作帮助我们了解模型在哪些地方有用、在哪些地方会失败,以及如何将它们集成到科学过程中——从文献回顾和证明生成到建模、仿真和实验设计。

我们的方法结合了两种互补的信念。专门的科学工具,如仿真引擎、蛋白质数据库和计算机代数系统,对于效率和精度至关重要。与此同时,基础模型的扩展不断解锁新的推理能力:跨领域连接思想、勾勒证明、提出机制,以及进行概念性的而非关键词驱动的大量文献导航。在存在专门工具的地方,我们希望使用它们;在需要通用推理的地方,我们构建旨在处理这种情况的模型。两条路径是相互强化的。

科学家们今天如何使用 GPT-5

最有意义的进展来自于人类-AI 团队。科学家设定议程:他们定义问题、选择方法、批判想法并验证结果。GPT-5 贡献了广度、速度以及并行探索多个方向的能力。

有效利用 GPT-5 是一项技能。研究人员学习如何提问、何时坚持、如何将问题分解为步骤,以及哪些内容需要独立验证。富有成效的工作通常看起来像一场对话——研究人员和模型不断迭代,直到出现有希望的方向或想法被放弃。

GPT-5 在科学工作中的当前状态

在这些早期的研究中,当被专家使用时,GPT-5 似乎能够缩短研究工作流程的某些部分。它不会自主运行项目或解决科学问题,但它可以扩大探索的范围,并帮助研究人员更快地得出正确的结果。

  • 一项新兴能力是概念性文献搜索。GPT-5 通常可以识别思想之间更深层次的关系,并从语言和较难获取的来源中检索相关材料。研究人员报告称发现了以前不知道的参考文献、联系和论点。
  • 在数学和理论计算机科学中,结构明确且反馈循环快速的领域,GPT-5 尤其有帮助。数学家们利用 GPT-5 在几分钟内生成了可行的证明大纲,将原本可能需要数天或数周的工作转化为实际成果。在物理学和计算领域,该模型可以提出简化变换,或指出其他领域的类似结构。
  • 在生物学和其他实证科学中,该模型可以提出机制并设计实验以在湿实验室中验证这些假设。

我们已经超越了模型仅总结现有知识的阶段。现在,GPT-5 的早期贡献可以在专家监督下有意义地协助研究人员。改进的速度表明,随着能力和工具的进步,未来有潜力实现更深层次的加速。

实践中的应用:几个案例研究

在科学前沿独立重新发现已知结果

优化是寻找“最佳”选择的数学——例如最低训练损失或网络中最短路径。Guy Barzilai、Ohad Shamir 和 Moslem Zamani 最近的一篇论文探讨了梯度下降序列何时会随时间形成一条凸曲线(一条没有凹陷的曲线),这使得算法行为更容易分析和控制。论文的第一版仅针对非常小、保守的步长证明了这一点。

Sébastien Bubeck 将较弱版本的结果提供给 GPT-5,询问是否可以改进条件,模型提出了一个更严格的步长界限和一个更清晰、更标准的证明,然后他手工仔细检查了这些结果;通过更多的思考时间,模型内部运行甚至从零开始推导出了最优界限。

GPT-5 的贡献: GPT-5 帮助 Sébastien Bubeck 探索了更严格的步长条件,并提出了一个更清晰的证明,用于一个近期的凸优化定理,他独立验证了该证明。

在广义相对论中,旋转黑洞由 Kerr 解描述,围绕它们的波满足一个复杂的微分方程。物理学家寻找这些方程的对称性——使其保持不变的变换——因为对称性带来了守恒量和简单的结构。Alex Lupsasca 最近的工作表明,Kerr 波方程具有形成 SL(2,ℝ) 代数的隐藏对称结构,这有助于解释为什么某些潮汐响应会消失。

当我们直接询问 GPT-5 Pro 关于完整的 Kerr 问题时,它最初失败了,并报告没有有趣的对称性。在 Lupsasca 给了它一个更简单的“热身”版本的同一结构(在平坦空间中)后,我们回到了 Kerr 案例;这一次,在内部推理了大约 18 分钟后,模型生成了与人类结果相匹配的、闭合于 SL(2,ℝ) 的完整对称生成器集合。

GPT-5 的贡献: 在给定一个合适的预热问题后,GPT-5 Pro 重建了 Kerr 黑洞波方程的隐藏 SL(2,ℝ) 对称代数,Lupsasca 证实了结果。

现代免疫疗法(尤其是依赖工程 T 细胞的 CAR-T 癌症治疗)中的一个关键问题是如何保持有益的 T 细胞活性和持久性,同时不使其陷入疲惫、功能失调的状态。现有文献表明,暂时限制葡萄糖代谢可以持久地重新编程 T 细胞,使其更具促炎性。在早期的一项研究中,Derya Unutmaz 及其同事用 2-脱氧葡萄糖 (2DG)(一种干扰葡萄糖代谢的化合物)短暂处理了人 CD4+ T 细胞(一种关键的免疫细胞)。移走 2DG 并在用 IL-2(一种告诉 T 细胞增殖的信号分子)启动 CD4+ T 细胞后,他们看到了向促炎性 Th17 样状态(T 细胞的一个亚型,参与保护和自身免疫性疾病)的持续转变,并花了数月的实验和阅读才得出一个合理的机制来解释这种效应。

多年后,他向 GPT-5 Pro 展示了一张未发表的流式细胞术散点图,其中显示了用不同水平的葡萄糖和 2DG 处理后不同的 T 细胞亚群——并询问可能是什么解释了这些数据以及下一步应该进行什么实验。在大约十几分钟的来回交流中,该模型建议,在启动过程中中断的N-连接糖基化(细胞将糖链附着到蛋白质上的方式)是驱动因素,并预测负责的是记忆 (而非幼稚) T 细胞。然后 GPT-5 提出了具体的后续实验,包括一个优雅的甘露糖挽救实验,该实验恢复了 N-糖基化,但没有恢复糖酵解。该实验室先前已进行过甘露糖挽救实验,结果与模型的预测完全吻合。

GPT-5 Pro 随后能够分析用 2DG 处理的 CD8+ T 细胞的未发表数据,并预测瞬时 2DG 暴露在 CAR-T 生成过程中将导致针对靶癌细胞系的杀伤效率提高。GPT-5 Pro 的预测与实验室的未发表实验数据相符。

GPT-5 的贡献: GPT-5 分析了未发表的数据,得出了非显而易见且有价值的机制性假设,确定了起作用的 T 细胞亚群,并提出了后续实验,Unutmaz 的实验室随后进行了测试和确认。

深度文献搜索

Nikita Zhivotovskiy 和他的合作者证明了凸几何学中的一个新定理——研究“良好行为”形状,其中连接任意两点的直线都保持在形状内部。凸几何学是许多机器学习和统计模型的基础。定理完成后,自然而然的下一个问题是:这个结果还能在哪些地方有用?

Zhivotovskiy 没有猜测搜索词并手动扫描文献,而是将定理的形式陈述交给 GPT-5,询问它可能与哪些领域相关联。该模型指出了密度估计、学习理论和多目标优化方面的工作,并提供了一些具体的参考文献,其中包括他以前从未见过的一些,以及一些其他语言的文献。

GPT-5 的贡献: GPT-5 帮助 Nikita Zhivotovskiy 确定了跨越几个领域的具体联系和参考文献,包括他以前未曾接触过的材料。

Paul Erdős 提出了 1000 多个问题,其中许多问题被记录在一个公共网站上。有些问题仍然被列为“开放”,即使解决方案存在于晦涩的期刊或非英语论文中。Mehtaab Sawhney 和 Mark Sellke 使用 GPT-5 作为该数据库的文献搜索助手:对于每个声称开放的问题,他们要求它搜索解决方案或主要的局部进展。

GPT-5 为几个仍标记为开放的问题找到了完整的解决方案,为其他问题确定了实质性的局部结果,并标记了一个问题陈述中的印刷错误。对于 Erdős 问题 #848,网站上的人类评论已经概述了大部分结构;GPT-5 提出了一个关键的密度估计,Sawhney 和 Sellke 对其进行了修正和收紧,形成了一个完整的证明,解决了这个问题。

GPT-5 的贡献: GPT-5 协助定位了遗漏的解决方案,并提出了一个密度估计,Sawhney 和 Sellke 将其完善为 Erdős 问题 #848 的完整证明。

纠错码向数据添加冗余,以便即使在比特损坏时也能恢复信息。这项研究检查了一种特殊的二进制码,其中每个位置对应于图中的一条边,目标是排除看起来像“小集团”(一组完全连接的节点)的任何码字。挑战在于确定从根本上需要多少奇偶校验位才能防止这种结构化错误。GPT-5 使用有限域上的二次方程重新构建了问题,并突出显示了一个经典的 Chevalley–Warning 定理,该定理立即指出了正确的下界——表明所需的约束比先前认为的要少大约一半。

随后出现了一个意外的转折:几乎完全相同界限和几乎相同的证明,多年前就出现在一篇简短的研究论文中。GPT-5 复制了这个论证,但没有引用其来源,直到在新的会话中被再次询问时才确认了先前的工作。这强调了人工智能辅助数学中的一个重要教训:模型可以产生正确且优雅的推理,但它们可能无法可靠地归因于思想的原始出处。仔细的验证和对归因的关注仍然至关重要。

GPT-5 的贡献: GPT-5 提供了导致最优下界的关键重构和经典定理。然而,在被明确询问之前,该模型并未识别出先前的出版物,凸显了对归因进行仔细人工检查的必要性。

与人工智能协同工作

菲尔兹奖得主组合数学家 Tim Gowers 进行了一系列实验,将 GPT-5 视为“研究伙伴”,而不是完成作业式问题的工具。他向模型提出了他正在积极思考的难题,并要求它提出构造、寻找反例或批判部分论证。

在好几种情况下,GPT-5 迅速发现了候选构造中的缺陷或缺失案例,并提出了更简单的替代方案或反例;在其他情况下,它停滞不前或未能取得进展。Gowers 的总体结论是,该模型已经可以作为一个非常快速、知识渊博的评论家而有用,可以对想法进行压力测试并节省时间,尽管它尚未达到他共同署名的标准。

GPT-5 的贡献: 在探索性组合学工作中,GPT-5 充当了 Tim Gowers 的快速评论家,发现了缺陷、缺失的案例和更简单的替代方案。

宇宙学使用简化模型来描述宇宙的大尺度行为,包括暗能量和膨胀历史。这些模型通常以几种数学等效形式存在,小的代数错误可能会使计算偏离正轨。Robert Scherrer 使用 GPT-5 来校验推导过程、探索宇宙学模型的玩具版本,以及在暗能量的不同参数化之间进行转换。

GPT-5 在捕捉代数错误、提出同一物理思想的等效表述以及将 Scherrer 指向与他独立推导的模型相匹配的现有文献结果方面特别有用。这减少了将纸面上的想法转化为可以与数据进行比较的形式之间的摩擦。

GPT-5 的贡献: GPT-5 通过检查推导、提出等效表述并指出文献中匹配的结果,协助了 Robert Scherrer。

聚变和等离子体物理学涉及模拟高温、高密度等离子体,初始条件的微小变化可能导致截然不同的行为。运行和解释这些模拟既昂贵又耗时。这项工作利用 GPT-5 帮助构建和分析一个简化的热核燃烧传播反应-扩散模型,解释复杂的输出,并探索不同密度剖面如何影响燃烧性能。该模型帮助进行了参数扫描,并确定了一个最优剖面“脊线”,在该脊线上燃烧前沿移动最快。

GPT-5 还协助提出了对这些数值模式的理论解释,使用能量平衡论证来解释为什么某些剖面表现更好,并提出简单的工程规则来指导未来的设计。虽然该模型偶尔会产生不稳定的模拟或过于自信的结论,但专家监督使得快速纠正成为可能,从而大大加快了从“这个状态下有些奇怪的事情正在发生”到“这里有一个合理的解释和一个具体的测试”的进程。

GPT-5 的贡献: GPT-5 帮助构建了简化物理模型,探索了参数空间,并提出了物理解释。

利用 AI 获得新的科学成果

Paul Erdős 提出了一个关于寻找具有惊人规则的正整数集合的问题:集合中任意两个数,它们的乘积加一必须始终能被一个完全平方的素因子整除。Erdős 猜测了最大集合的样子,但这个问题几十年仍未解决。

Sawhney 和 Sellke 探索了问题的结构,然后要求 GPT-5 帮助分析一个“位置错误”的数字如何影响整个集合。GPT-5 提出了一个更清晰的方法来表明,如果甚至有一个数字不符合特定模式,它就会在几乎所有其他数字中强制产生矛盾。这个想法正是缺失的步骤。有了它,研究人员完成了完整的证明,表明 Erdős 最初的猜测是正确的。

GPT-5 的贡献:GPT-5 浮现了关于一个数字如何约束所有其他数字的关键见解,使作者能够完成 Erdős 问题 #848 的证明。

在线算法逐步做出决策,而不知道未来会发生什么——例如,当约束随着时间显现时决定如何移动系统。在凸体追逐问题中,算法必须保持在一个移动的凸区域内,同时保持总移动量很小。一个中心问题是最佳的竞争比:在最坏的情况下,在线算法可能比理想的离线算法(可以预先看到整个序列的算法)差多少。

Christian Coester 使用 GPT-5 来集思广益可能迫使任何在线算法表现不佳的困难实例和构造。该模型突出了一种特定的几何构造,经过 Coester 的完善和检查后,该构造产生了比先前已知的更清晰、更强的竞争比下界。

GPT-5 的贡献: GPT-5 提出了一个几何构造,Christian Coester 将其完善为一个更强的在线算法问题的下界。

该团队研究了一个关于在树(无环图)中计算小模式(路径、星形和“Y”形)的图论问题。先前的工作已经证明了一个关系这些计数的不等式,并推测了第二个,但后者一直未被证明。使用围绕 GPT-5 的自定义数学脚手架,作者首先要求该模型重新证明已知的不等式,然后攻击推测的那个。

GPT-5 证明了这两个不等式的简短、自洽的证明,依赖于与原始人工证明不同且更优雅的论证;Bubeck、Sellke 和 Yin 随后在他们的报告中检查并采纳了模型的论证。

GPT-5 的贡献: GPT-5 为树中的两个不等式(包括一个推测的不等式)生成了简短的证明,作者独立检查并采纳了该论证。

研究人员研究了一个简单的增长网络模型,其中每个新节点以受隐藏参数 w 影响的概率附加到早期节点上。挑战在于,一旦网络增长,您只能看到最终的未标记树——看不到产生它的隐藏标签或附加规则。悬而未决的问题是 w 是否可以仅从最终结构中恢复。

该团队要求 GPT-5 推理最终树中可能可靠地反映 w 值的哪些全局模式。该模型侧重于一个令人惊讶的易于访问的统计数据:最终成为叶节点的节点的长期分数。GPT-5 概述了该叶分数如何收敛到 w 的一个简单、严格递增的函数,这意味着 w 可以直接从树的形状中读出。在这一指导下,作者得出了一个完整的证明,表明该参数确实是可识别的。

GPT-5 的贡献: GPT-5 突出了关键的可观察指标——叶... [内容被截断]




🚀 想要体验更好更全面的 AI 调用?

欢迎使用青云聚合 API,约为官网价格的十分之一,支持 300+ 全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区