📢 转载信息
原文链接:https://openai.com/index/gpt-5-mathematical-discovery
原文作者:OpenAI
2025年11月24日
GPT-5 助力数学家 Ernest Ryu 解决一个困扰 40 年的开放性难题
一位数学家如何使用 GPT‑5 快速探索想法和技术,最终找到解决一个长期存在的优化问题的途径。
解决问题的背景与意义
每一个重大的数学问题背后都有一个故事——有人提出了一个问题,有人试图解决它,有人未能成功,最终,也许有人成功了。解决一个令人沮丧的优化理论简单问题的故事也不例外,只是这位研究人员借助了一个能够快速从大量数学论文中挖掘想法和技术的工具。
在应用数学和优化理论领域拥有 15 年经验的加州大学洛杉矶分校(UCLA)教授 Ernest Ryu 对大家都在谈论的大型语言模型(LLM)感到好奇。2023 年,他决定测试 ChatGPT‑3.5 解决简单数学和逻辑问题的能力,比如跨时区安排多人会议。他注意到模型能理解隐含的约束条件(比如没人想在午夜 12 点到早上 6 点开会),但其得出准确结果的能力波动很大。在他看来,模型虽有许多优点,但仍有很长的路要走。
两年后,当 OpenAI 推出 GPT‑5 时,Ryu 开始听说其在数学方面能力的飞速提升。他决定再次尝试,看看这个成熟的模型是否能处理更复杂的问题。他当时并没有期望这能对解决他领域中一个长期存在的问题产生有意义的贡献。
Ryu 决定攻克一个“开放性”问题,即尚未解决且在学术界公认具有研究价值的问题。他的数学直觉告诉他,这个问题可能有一个简单的解法;只是人类尚未找到而已。
这个问题是:当一个算法使用被称为 Nesterov 加速梯度(NAG)的现象时,其速度会大大加快——但 NAG 增加的额外动量是否会影响算法的稳定性呢?
与可能因过度使用而损坏的汽车发动机不同,NAG 似乎提供了一种“加速”而不会引入不稳定的特性。几十年来,研究人员观察到了这种行为,但他们无法完全解释其背后的根本原因,即为什么这种方法既能保持快速又能保持稳定。
NAG 最初由数学家 Yurii Nesterov 于 1983 年引入,是一种优化方法,它使用一种预测形式——通常描述为“向前看”——来加快算法收敛的速度。与传统的算法(它们采取渐进的步骤并计算梯度,即函数斜率在给定点的方向和陡峭程度)不同,NAG 会在“向前看”的点上计算梯度,从而使算法能够进行更明智的最终更新。通过预测参数的位置,而不是计算时其当前状态的位置,NAG 有助于更有效地引导算法的步骤,更快地收敛,并管理其在接近函数最小值时的固有振荡,从而更快地朝着解决方案取得进展。
简单来说,优化理论家们想知道为什么算法动量的增加不会显著影响其稳定性。在训练机器学习模型或解决工程问题时,效率对于避免浪费计算资源和产生缓慢结果至关重要。
Ryu 说:“通过扩展优化理论中可用的理论工具,我们共同设计出在效率、稳定性和安全性方面都经过优化的算法。”他和几位同事多年前就曾试图解开这个谜团,但未能得出揭示解决方案的数学证明。
使用 GPT‑5 探索问题
当 Ryu 继续向 GPT‑5 输入提示词时,通常是在孩子们睡着后的深夜,他对模型在尝试解决这个基本问题时的创造性和非常规方法印象深刻。然而,当他仔细检查模型的成果时,他会发现其推理中的错误。问题仍然没有解决。
他说:“它有一个我从未想过的有趣方法”——这与他珍视的数学头脑风暴中的人类思维非常相似。“所以,这就是我决定,好吧,让我把这件事推得更远的原因。”
在此过程中,GPT‑5 并没有发明新的数学工具和原理。它非常擅长运用现有的工具,并能从给定的专业领域之外的论文中找到方程、解决方案和想法,这些是 Ryu 可能否则不会遇到的。“它尝试的一些怪异之处令我惊讶。它能从海量阅读和学习中提取信息的能力,正是它强大的所在。”
Ryu 不断地进行提示,同时将 GPT‑5 视为一个可以与之一起反思想法的合作者。他注意到模型会持续产生能将他推向新的、意想不到的方向的创意。当他提出一个问题时,它会提供一个方向——无论对错——Ryu 会迅速评估。如果这个想法看起来像是死胡同,他会立即转向;如果它显示出希望,他会追随它,看看能引导到哪里。这个过程的速度之快,将通常需要数天的工作压缩到了数小时内。
Ryu 说:“GPT‑5 是一个非常不寻常的合作者,因为它会提出一些完全出乎意料的东西。”
“数学研究的工作方式是,你有一些想法,当您或您的同事想出一个粗略的想法时,您就能感觉到它是否会成功。这正是人工智能和人类合作可以特别发挥作用的地方。”
GPT‑5 使 Ryu 能够考虑他原本不会想到的解决该证明的新潜在途径,原因可能是他没有看到联系,或者这些途径来自他不太熟悉的相邻数学领域。随着 Ryu 与 GPT‑5 持续探索想法,一件事变得越来越明显:当与专业知识和仔细验证相结合时,这些系统可以成为强大的探索工具。
Ryu 说:“数学研究的工作方式是,你有一些想法,当您或您的同事想出一个粗略的想法时,您就能感觉到它是否会成功,就像一种数学直觉一样。这正是人工智能和人类之间的伙伴关系可以特别有效地发挥作用的地方。”
他继续采用这种方法,向 LLM 寻求新想法,排除他认为是死胡同的想法,并追逐那些他认为有潜力的想法。
此外,他与 GPT‑5 生成、评估、探索和穷尽想法的速度明显快于他独立工作时的速度。在与 GPT‑5 协作了三天,大约十二小时后,在尝试了近十几种方法后,他正在研究的方法之一终于奏效了。
转折点
这个转折点出现在模型提出了重构控制 NAG 方法的方程的一种方式时。这个建议写出来时并不正确,但 Ryu 识别出了其中似乎有意义的结构特征,自己更严谨地发展了它,并开始向模型提出有针对性的问题来测试潜在证明的可行性。那条探究路线最终成为了他自己写出的最终证明的主干。
他说:“那是一种超现实的感觉”,他将这种经历比作与一个能提出想法、提出问题和集思广益的称职学生一起工作。Ryu 说:“与 GPT‑5 合作在智力上真的令人兴奋。我必须警惕地检查计算步骤,但这仍然比我自己做计算要快得多。”
尽管过程明显加快了,但它也需要仔细的验证。GPT‑5 经常产生看似合理但在检查后站不住脚的论证。Ryu 审查了每一个建议,排除了失败的建议,并发展了那些包含有数学意义的想法的建议。工作流程取决于他的判断——既要识别有希望的方向,也要认识到何时一条推理路线已被充分探索。
Ryu 将 GPT‑5 用作工具,他非常注意理解它在做什么,以便他能够辨别它的长处和短处。在要求 GPT‑5 检查工作时,Ryu 发现在新对话中开始检查比在同一对话中要求模型检查其工作效果更好。他将结果输入到新对话中的过程有助于最大限度地减少累积的错误。然后,他说,“你可以坐下来自己仔细检查所有细节”,就像研究过程中通常会做的那样。
在每一次对话中,Ryu 都会提出一个问题,向 GPT‑5 索要一个方向或技术,并收到一个数学论证——有时正确,有时有缺陷,有时完全出乎意料。虽然 GPT‑5 生成的许多论证都是不正确的,但它在执行人类通常会觉得认知疲惫的事情方面表现出色:快速提出和抛弃同一想法的变体,搜索论证空间,并从相邻的子领域借用数学工具来详尽地搜索答案。据 Ryu 说,“最终重要的几个关键步骤都是 GPT‑5 建议的”,尽管它无法自行将它们组合成一个完整的证明。
这种动态就像与一个能即时揭示新路径的伙伴一起探索一个巨大的迷宫。大多数路径都通往别处,但探索的速度意味着可以更快地发现死胡同。在经典的研发流程中,排除一个想法可能需要大量时间。
利用 GPT‑5 进行探索的主要好处是模型在整个过程中提供的加速。它能从庞大的文献数据库中提取信息的速度,使 Ryu 能够快速排除死胡同的方法并追寻有希望的路径。在大约十二小时内,Ryu 解决了这个问题,他估计如果他以那个速度去追求,可能需要数周的专注工作。
他说:“但这永远不会发生。因为在努力尝试了三天之后,我就会放弃了。作为一个数学家,你必须决定是否要放弃问题,转而研究下一件事。”
但有了 GPT‑5,他有一种快速取得进展的感觉,这让他坚持了下来。在他看来,这造成了一种心理上的转变:源源不断的新想法使这个问题感觉更接近可及的范围,比以往任何时候都更持久。
这对 Ryu 未来的研究意味着什么
作为一名教授,Ryu 非常重视人工智能与学习之间的关系。它是一种必须被理解和利用才能获取价值的工具。任何使用人工智能的人都需要对他们正在探索的主题有足够的了解,才能知道模型何时提出了好的想法,何时提出了不正确的想法,以及何时犯了错误。
Ryu 解决 NAG 问题的预印本论文可公开获取,目前正在同行评审过程中,这通常需要 12-18 个月。为了吸引更广泛的数学界,Ryu 按照传统风格撰写了他的论文。GPT‑5 提出了几个塑造最终证明的关键想法,但对于这篇论文,Ryu 对其进行了整理,并自己撰写了相关的叙述。论文的标题和摘要中提到了 GPT‑5,并且通篇解释了它的贡献。在深入思考如何将 GPT‑5 协助解决这一证明的合作纳入致谢后,他最终决定它被用作工具,这就是为什么 GPT‑5 没有被列为共同作者。
Ryu 说:“我希望这是一个案例研究,可以告知古典数学家使用 GPT‑5 的潜在价值。为了做到这一点,我觉得我应该遵守发表期刊论文和这种治学方式的经典风格。”
Ryu 的经验只是 GPT‑5 如何帮助世界上最聪明的人找到解决人类最复杂和最有趣问题的答案的一个例子。他的成功在很大程度上依赖于他在数学领域的专业知识,以及他愿意在每一步都对 LLM 的推理和断言进行二次、三次甚至四次检查。
归根结底,Ryu 认为当研究人员以富有成效和积极的方式使用人工智能时,这将是一件好事。他预计来自相邻领域的想法多样性将变得更容易获得,他认为这是一个积极的发展。
Ryu 说:“保持耐心。如果你想让模型失败,它就会失败。但如果你的心态是想与模型合作以提取价值,那么你成功的可能性就更大。”
Ryu 说:“这次经历真的对我有深远的影响。我计划将来在我的数学研究中一直使用人工智能。我没有理由不这样做。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区