📢 转载信息
原文链接:https://openai.com/index/gpt-5-mathematical-discovery
原文作者:OpenAI
2025年11月24日
GPT‑5 助力数学家 Ernest Ryu 解决 40 年悬而未决的难题
一位数学家如何利用 GPT‑5 快速探索想法并找到解决一个长期存在的优化问题的途径。
难题及其重要性
每一个重大的数学问题背后都有一个故事——有人提出了一个疑问,有人尝试去解决它,有人未能成功,直到最终,也许有人成功了。回答一个令人沮丧的优化理论简单问题的故事也不例外,只是研究人员借助了一个能够快速梳理广泛数学论文中的想法和技术的工具。
在应用数学和优化理论领域拥有 15 年经验的加州大学洛杉矶分校(UCLA)教授 Ernest Ryu 对大家热议的大型语言模型(LLM)感到好奇。2023 年,他决定测试 ChatGPT‑3.5 解决简单数学和逻辑问题的能力,比如跨时区安排多人会议。他注意到模型能理解隐含的约束条件(例如没人想在午夜 12 点到凌晨 6 点开会),但其生成准确结果的能力参差不齐。在他看来,模型有很多优点,但仍有很长的路要走。
两年后,当 OpenAI 推出 GPT‑5 时,Ryu 开始听说它在数学方面的能力突飞猛进。他决定再次尝试,看看这个成熟的模型是否能处理更复杂的问题。他当时并未料到,这会对他领域的长期难题产生有意义的贡献。
Ryu 决定挑战一个“悬而未决”的问题,即社区公认的、尚未解决的难题。他的数学直觉告诉他,这个问题可能存在一个简单的解决方案;只是人类尚未找到而已。
这个问题是:当一个算法使用一种称为 Nesterov 加速梯度(NAG)的现象时,它会快得多——但 NAG 带来的额外动量是否会影响算法的稳定性呢?
与可能会因过度使用而失效的汽车引擎不同,NAG 似乎提供了“加速”而不会引入不稳定性。几十年来,研究人员观察到了这种行为,但他们无法完全解释这种方法既能保持快速又能保持稳定的根本原因。
NAG 最初由数学家 Yurii Nesterov 于 1983 年引入,它是一种优化方法,使用一种预测形式——通常被描述为“向前看”——来加速算法收敛的速度。与执行增量步骤并计算梯度(即函数在给定点的斜率的方向和陡峭程度)的传统算法不同,NAG 在一个超前点计算梯度,使算法能够进行更明智的最终更新。通过预测参数的位置,而不是计算时它所处的当前状态,NAG 有助于更有效地指导算法的步骤,更快地收敛,并控制其在接近函数最小值时的固有振荡,从而更快地朝着解决方案取得进展。
简单来说,优化理论家们想知道为什么算法动量的增加不会显著影响其稳定性。在训练机器学习模型或解决工程问题时,效率对于避免浪费计算资源和产生较慢的结果至关重要。
“通过扩展优化理论中可用的理论工具,我们共同设计出在效率、稳定性和安全性方面得到优化的算法,”Ryu 说。他和其他几个人多年前曾试图解开这个谜团,但未能得出揭示解决方案的数学证明。
用 GPT‑5 探索问题
Ryu 继续向 GPT‑5 提问,常常在他孩子睡后工作到深夜。他对模型在尝试解决这个基本问题时所展现出的创造性和非常规方法印象深刻。然而,当他仔细检查模型的推理工作时,他会发现其中的错误。问题仍然没有解决。
“它有一个我从未想过的有趣方法,”他说,这很像他在数学头脑风暴中非常重视的人类思维。“所以,我决定,好吧,让我进一步推动它。”
在这个过程中,GPT‑5 并没有发明新的数学工具和原理。它非常擅长运用现有工具,并能从特定专业领域之外的论文中找到方程、解决方案和想法,这些内容 Ryu 可能本来不会接触到。“它尝试的那些奇特事物让我感到惊讶。它能从如此大规模的阅读和学习中提取信息的能力,正是它真正强大的原因。”
Ryu 一直在提问,同时将 GPT‑5 视为一个可以与之交流想法的协作者。他注意到模型会不断提出富有创意的想法,将他引向新的、意想不到的方向。当他提出一个问题时,模型会给出一个方向——无论对错——Ryu 会迅速评估。如果这个想法看起来像一条死胡同,他会立即转向;如果它显示出希望,他会深入探究以了解其导向何处。这个过程的速度之快,将通常需要几天才能完成的工作压缩到了几小时内。
“GPT‑5 是一个非常不寻常的协作者,”他说,“因为它会提出一些完全出乎意料的东西。”
“数学研究的工作方式是,你会有一些想法,当你或你的同事想出一个大致的想法时,你就能判断它是否会成功。这就是人工智能与人类合作能特别有效地发挥作用的地方。”
GPT‑5 使 Ryu 能够考虑他原本不会想到的解决证明的新潜在路径,原因可能是他没有看到某种联系,或者这些路径来自他不太熟悉的相邻数学领域。随着 Ryu 与 GPT‑5 持续探索想法,一件事变得越来越明显:当与主题专业知识和仔细验证相结合时,这些系统可以成为强大的探索工具。
“数学研究的工作方式是,你会有一些想法,每当您或您的同事想出一个粗略的想法时,您就会有一种感觉,它是否会奏效,就像一种数学直觉一样,”Ryu 说。“这就是人工智能与人类之间的伙伴关系可以特别有效地发挥作用的地方。”
他继续采用这种方法,向 LLM 征求新想法,排除他认为行不通的想法,并追逐那些他认为有潜力的想法。
此外,他和 GPT‑5 生成、评估、探索和穷尽想法的速度比他独自工作时要快得多。在与 GPT‑5 协作了三天,经历了大约十二小时,并尝试了近十种方法后,他正在研究的方法之一终于奏效了。
转折点
转折点出现在模型提出了一种重组管理 NAG 方法的方程组的方式时。该建议本身的书写并不正确,但 Ryu 识别出了其中看似有意义的结构特征,独立地对其进行了更严格的发展,并开始向模型提出有针对性的问题,以测试潜在证明的可行性。那条探究思路最终成为了他自己撰写最终证明的骨干。
“那是一种超现实的感觉,”他说,他将这种经历比作与一个会提出想法、提出问题和集思广益的称职学生一起工作。“与 GPT‑5 合作在智力上非常令人兴奋,”Ryu 说。“我必须对计算步骤保持警惕,但这仍然比我自己做计算要快得多。”
尽管这个过程速度快了很多,但也需要仔细验证。GPT‑5 经常产生看似合理但经不起推敲的论点。Ryu 审查了每一个建议,丢弃了不成立的,并发展了那些包含有数学意义的想法的论点。工作流程依赖于他的判断——既能识别出有前景的方向,也能认识到一条推理路径已被充分探索。
Ryu 将 GPT‑5 用作工具,他非常注意了解它在做什么,以便他能分辨出它的强项和弱项。在要求 GPT‑5 检查工作时,Ryu 发现,如果他开始一个新的对话,而不是在同一个对话中要求模型检查其工作,效果会更好。他将结果输入到新对话中的过程有助于最大限度地减少累积错误。然后,他说,“你可以坐下来,自己仔细检查所有细节,”就像研究过程中通常会做的那样。
在每次会话中,Ryu 都会提出一个问题,向 GPT‑5 征求一个方向或技术,并收到一个数学论证——有时正确,有时有缺陷,有时完全出乎意料。虽然 GPT‑5 生成的几个论证是错误的,但它在人类通常会觉得认知疲惫的事情上表现出色:快速地提出和放弃同一想法的变体,搜索可能论证的空间,并从相邻的数学子领域借用工具来穷尽地搜索答案。根据 Ryu 的说法,“最终起关键作用的几个步骤都是由 GPT‑5 提出的”,尽管它无法独立地将它们组合成一个完整的证明。
这种动态类似于与一个能即时揭示新路径的同伴一起探索一个巨大的迷宫。大多数路径都通向死胡同,但探索的速度意味着死胡同被更快地发现。在传统的研发流程中,排除一个想法可能需要大量时间。
利用 GPT‑5 进行这种探索的主要好处是模型在整个过程中提供的加速。它能从庞大的文献数据库中提取信息的速度,使 Ryu 能够迅速排除死胡同,并追求有希望的路径。在大约十二小时内,Ryu 解决了这个问题,他估计如果他以那种速度追求,可能需要数周的专注工作才能解决。
“但这永远不会发生,”他说。“因为努力尝试了三天后,我就会放弃了。作为一个数学家,你必须决定是放弃这个问题还是转向下一个问题。”
但有了 GPT‑5,他感觉取得了快速的进展,这让他坚持了下来。在他看来,这带来了一种心理上的转变:源源不断的新想法让这个问题感觉更接近成功,比没有 AI 协助时更容易坚持下去。
这对 Ryu 未来的研究意味着什么
作为一名教授,Ryu 非常重视人工智能与学习之间的关系。它是一种必须被理解和利用才能从中获取价值的工具。任何使用人工智能的人都需要对其探索的主题有足够的了解,才能判断模型何时提出了好主意,何时提出了不正确的想法,以及何时犯了错误。
Ryu 解决 NAG 问题的预印本论文在线公开(opens in a new window),目前正在同行评审过程中,预计需要 12-18 个月。为了吸引更广泛的数学界,Ryu 用传统的风格撰写了他的论文。GPT‑5 提出了塑造最终证明的几个关键想法,但对于这篇论文,Ryu 对其进行了整理并自己撰写了,以及相关的叙述。论文的标题和摘要中提到了 GPT‑5,并且论文中解释了它的贡献。在深入思考如何为 GPT‑5 协作的帮助以解决这个证明进行署名后,他最终决定将其用作工具,这就是 GPT‑5 未被列为合著者的原因。
“我希望这是一个案例研究,可以告知传统的数学家使用 GPT‑5 的潜在价值。为了做到这一点,我认为我应该遵循传统的期刊论文发表风格和这种学术研究方式,”Ryu 说。
Ryu 的经历只是 GPT‑5 如何帮助世界上最聪明的人找到人类最复杂、最引人入胜的问题的解决方案的一个例子。他的成功在很大程度上依赖于他在数学领域的专业知识,以及他愿意在每一步仔细检查 LLM 的推理和断言的意愿。
最终,Ryu 认为研究人员以富有成效和积极的方式使用人工智能将是一件好事。他预计来自相邻领域的想法多样性将变得更加容易获得,他认为这是一个积极的发展。
“要有耐心,”Ryu 说。“如果你想让模型失败,它就会失败。但如果你的心态是想与模型合作以提取价值,那么你成功的可能性就更大。”
“这次经历真的对我产生了深远的影响。我计划今后在我的数学研究中一直使用人工智能,”Ryu 说。“我没有理由不这样做。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区