📢 转载信息
原文链接:https://www.wired.com/story/openai-codex-race-claude-code/
原文作者:Maxwell Zeff
Sam Altman 盘腿坐在办公椅上,深邃地凝视着天花板。说实话,位于旧金山 Mission Bay 的 OpenAI 新总部——一座玻璃与浅色木材构成的圣殿——似乎就是为了激发这种沉思而设计的。接待处后面的一个售货亭里摆放着小册子,将“AI 的时代”描述为通往启蒙之路的阶梯。楼梯沿墙的标语记录着 AI 的里程碑式胜利,比如有一次,成千上万的人通过直播观看一台机器在 Dota 2 游戏中击败顶尖电竞选手。在走廊里,研究人员身着神圣的周边商品擦肩而过。一件 T 恤上写着“好的研究需要时间”。理想情况下,时间不宜过长。
Altman 和我身处一个巨大的会议室。我向他提出的问题是关于 AI 编程革命——以及为什么 OpenAI 似乎没有引领这场革命。数百万软件工程师已经开始将编程任务委托给 AI,迫使许多硅谷人士首次开始反思自己的工作被自动化的问题。编程助手已成为企业愿意为 AI 大量付费的少数几个领域之一。这一刻本应(而且可以说应该)成为 OpenAI 楼梯上又一个胜利的标语。但现在大写字母的名字属于另一个人。
Anthropic,一家由 OpenAI 叛逃者创立的规模较小的竞争对手,凭借其编程助手 Claude Code 取得了空前的成功。该公司表示,该产品占其业务的近五分之一,年化收入超过 25 亿美元。据一位直接了解情况的人士透露,截至 1 月底,OpenAI 的同类产品 Codex 的年化收入略高于 10 亿美元。这是怎么回事?
“第一个进入市场非常有价值,” Altman 终于说道。“我们通过 ChatGPT 实现了这一点。”但他表示,现在是 OpenAI 加大投入编程的时候了。他认为公司的 AI 模型已经足够强大,可以驱动功能强大的编程助手。(当然,该公司为此投入了数十亿美元进行训练。)“这将是一项巨大的业务——仅仅是它的经济价值,以及编程能够带来的通用工作的解锁,” Altman 说。“我不是轻易说这话,但我认为这是一个罕见的万亿美元级市场。”更重要的是,他说,Codex 是实现“通用人工智能”的“最可能途径”。根据 OpenAI 的定义,通用人工智能是指一个能够胜任大多数经济上有价值工作的 AI 系统。

Sam Altman, OpenAI's chief executive officer.
Photograph: MARK JAYSON QUINES然而,尽管 Altman 从他那宁静的盘腿姿势中自信地发表声明,但过去几年公司内部的现实却更加混乱。为了了解内幕,我采访了 30 多人,包括 OpenAI 的现任领导者和员工(他们是在公司批准下接受采访的),以及一些为了讨论私营公司的内部运作而选择匿名的人。他们的叙述描绘了一幅 OpenAI 处于一个它几乎从未有过的境地的画面:奋力追赶。
早在 2021 年,Altman 和 OpenAI 的其他领导人邀请 WIRED 记者 Steven Levy 前往他们位于旧金山 Mission 区的原始办公室,观看一些新东西。这是 OpenAI GPT-3 模型的一个分支,训练了来自 GitHub 的数十亿行开源代码。在一次演示中,高管们展示了名为 Codex 的工具如何接收英文指令并输出简单的代码片段。
“它实际上可以在计算机世界里代表你行动,”当时 OpenAI 的总裁兼联合创始人 Greg Brockman 说。“你真的有了一个可以执行命令的系统。”即使在那时,OpenAI 的研究人员也认为 Codex 将是开发“超级助手”的关键,这一点显而易见。
此时,Altman 和 Brockman 的生活围绕着与 OpenAI 最大投资者微软的会议展开。这家软件巨头正在利用 Codex 来驱动其首批商业 AI 产品之一——一个名为 GitHub Copilot 的代码补全工具,该工具可以在程序员的常规环境中工作。一位早期 OpenAI 员工告诉我,Codex “当时能做的不仅仅是自动补全”,但微软的高管将其誉为 AI 未来的标志。当 GitHub Copilot 于 2022 年 6 月公开推出时,在几个月内吸引了数十万用户。

Greg Brockman, OpenAI's president.
Photograph: MARK JAYSON QUINESOpenAI 的第一个 Codex 团队转而去处理其他项目。该员工表示,公司计划将编码能力整合到未来的模型中,认为没有必要单独进行一项工作。一些工程师被重新分配到 DALL-E 2,即该公司的图像生成器。其他人则转去训练 GPT-4,这被认为是让 OpenAI 更接近 AGI 的最佳方式。
然后,ChatGPT 于 2022 年 11 月推出,并在两个月内获得了超过 1 亿用户。其他所有项目都停止了。一位前 Codex 团队成员说,在接下来的几年里,OpenAI 没有专门的团队致力于 AI 编程产品。这似乎脱离了公司新近转向消费者关注的焦点。他们还补充说,“感觉这个领域已经被 GitHub Copilot ‘覆盖’了”。OpenAI 会提供新模型来驱动该工具,但这属于微软的地盘。
OpenAI 在 2023 年和 2024 年的大部分时间都投入到了多模态 AI 模型和代理的研发中——这些模型旨在理解文本、图像、视频和音频,并能像人类一样控制光标和键盘。这项努力似乎更符合 AI 行业的发展方向。初创公司 Midjourney 因其 AI 图像模型而病毒式传播,普遍认为大型语言模型需要看到和听到世界才能获得真正的智能。
Anthropic 则采取了不同的道路。它也涉足聊天机器人和多模态模型,但该公司似乎比 OpenAI 更早认识到编程的潜力。在最近的一次播客中,Brockman 称赞 Anthropic 从早期就“非常专注于编程”。他指出,Anthropic 不仅在学术竞赛的困难编程问题上训练其 AI 模型,还在混乱的代码库的实际问题上进行了训练。“这是一个我们有所延迟的教训,” Brockman 说。
2024 年初,Anthropic 在训练 Claude Sonnet 3.5 时使用了其中一些混乱的代码库。当该模型于当年 6 月发布时,许多用户对其编程能力印象深刻。在一家名为 Cursor 的初创公司尤其如此,该公司由一群二十多岁的年轻人创立,他们允许开发者通过用普通英语提问来与 AI 协同编程。据一位接近该初创公司的人士透露,当该公司整合了 Anthropic 的新模型后,Cursor 的使用量开始急剧上升。在几个月内,Anthropic 将开始内部测试自己的版本:Claude Code。
随着 Cursor 的流行度飙升,OpenAI 联系了这家初创公司,希望收购它。据接近该初创公司的人士告诉我,创始人拒绝了这项提议,甚至在谈判进入深入阶段之前就拒绝了。他们看到了编程行业的潜力,并希望保持独立。

Andrey Mishchenko, OpenAI's research lead for Codex.
Photograph: MARK JAYSON QUINES当时,OpenAI 正在训练其首个所谓的“推理模型” o1,该模型可以在给出答案之前逐步解决问题。在发布时,OpenAI 表示该模型“在准确生成和调试复杂代码方面表现出色”。Codex 的研究负责人 Andrey Mishchenko 表示,AI 模型在编码方面越来越强大,一个关键原因是这是一个可验证的任务。代码要么运行,要么不运行——这在模型出错时提供了清晰的信号。OpenAI 利用这个反馈循环来训练 o1 处理越来越难的编码问题。“如果没有能够爬取代码库、实现更改并测试自己工作 else——这些都属于推理的范畴——那么编码助手就不可能像现在这样强大,”他说。
到 2024 年 12 月,OpenAI 内部的几个小团队开始专注于 AI 编程助手。其中一个团队由 Mishchenko 和 OpenAI Codex 负责人、前 Google DeepMind 研究员 Thibault Sottiaux 领导。最初,他们对编程助手最感兴趣的是将其作为加快 AI 研究速度的一种方式——自动化管理训练运行和监控 GPU 集群的繁琐工作。另一个项目由 Alexander Embiricos 领导,他之前曾在 OpenAI 负责多模态代理,现在是 Codex 的产品负责人。Embiricos 创建了一个名为 Jam 的演示,该演示在公司内部广泛传播。

Thibault Sottiaux, OpenAI's head of Codex.
Photograph: MARK JAYSON QUINESJam 不是通过光标和键盘控制计算机,而是直接访问计算机的命令行。2021 年的 Codex 演示展示了一个可以输出代码供人类运行的 AI,而 Embiricos 的版本可以直接运行代码。他惊叹于跟踪 Jam 操作的网页在笔记本电脑上一次又一次地更新。
“有一段时间,我一直认为多模态交互可能是我们实现使命的方式——比如我们整天都在与 AI 共享屏幕,” Embiricos 说。“然后就变得非常清楚:也许让模型对计算机进行编程访问是我们实现目标的方式。”
这些项目需要数月时间才能合并成一个统一的努力。当 OpenAI 在 2025 年初完成 o3 的训练——这是一个比 o1 更侧重于编码的模型——它终于有了构建真正 AI 编程产品的基础。但 Claude Code 已经准备好公开发布了。
在 Claude Code 于 2025 年 2 月首次以“有限研究预览”形式发布,然后在同年 5 月公开发布之前,当时的先进技术是“氛围编码”(vibe coding)。人们为允许人类程序员在编码项目中进行引导,同时 AI 填写细节的工具支付了数亿美元。但 Anthropic 的新产品,就像 Jam 演示一样,直接从计算机的命令行进行操作,这意味着它可以访问开发者所有的文件和应用程序。这不再是氛围编码;开发者可以完全将工作外包给 AI 助手。
OpenAI 正在争先恐后地推出竞争产品。Sottiaux 告诉我,他于 2025 年 3 月组建了一个“冲刺团队”,其任务是在短短几周内整合 OpenAI 的内部团队并发布一款 AI 编程产品。与此同时,Altman 探索了另一项有助于 OpenAI 取得领先的收购——以 30 亿美元收购 AI 编程初创公司 Windsurf。OpenAI 管理层认为,Windsurf 将提供一个成熟的 AI 编程产品,一个知道如何在其基础上进行构建的团队,以及一个即时可用的企业客户基础。
但 Windsurf 的收购案却被搁置了数月。根据《华尔街日报》的报道,拖延的原因是微软,这家在所有事情上都是 OpenAI 的巨头合作伙伴,希望获得 Windsurf 的知识产权。这家云巨头自 2021 年以来一直使用 OpenAI 的模型来驱动 GitHub Copilot,该产品已成为微软财报电话会议的亮点。但随着 Cursor、Windsurf 和 Claude Code 提供了新的代理式编码体验,GitHub Copilot 开始让人感觉停留在 AI 的早期时代。OpenAI 再推出一款编码产品也无济于事。
Windsurf 的交易发生在一个 OpenAI 和微软关系特别紧张的时期。两家公司正在重新谈判合作关系,OpenAI 试图削弱微软对其 AI 产品和计算资源的控制。Windsurf 的交易成为了这个过程中的牺牲品,OpenAI 收购这家初创公司的交易于 7 月破裂。这时,Google 雇佣了 Windsurf 的创始人;其余团队则被另一家编码初创公司 Cognition 收购。
“我很想完成那笔交易,” Altman 说。“你无法控制每一笔交易。”尽管他曾希望 Windsurf 的收购“能让我们取得一些进展”,但 Altman 表示,他对 Codex 团队的发展轨迹印象深刻。在谈判期间,Sottiaux 和 Embiricos 一直在持续构建和发布更新。Altman 说,到 8 月份,OpenAI 已经按下了加速键。

Alexander Embiricos, OpenAI’s product lead for Codex.
Photograph: MARK JAYSON QUINESGreg Brockman 最喜欢衡量 AI 性能的方式是他多年前发明的一个名为“反图灵测试”的电脑游戏。他手工编写了这款游戏,现在他挑战 AI 代理从头开始构建自己的版本。他提供了基本规则:两名人类在各自的电脑上,在屏幕上看到一对聊天窗口。一个窗口连接到另一个人类,另一个窗口连接到 AI。游戏的目标是在欺骗对手认为自己是 AI 的同时,猜出哪个聊天窗口是 AI。
Brockman 说,在去年大部分时间里,公司最强大的模型需要数小时才能构建这样一个游戏,并且需要明确的人工指示和帮助。但到 12 月,Codex 已经能够通过一个精心构建的提示,使用新的 GPT-5.2 模型作为引擎,从一个提示创建了一个功能齐全的游戏。
注意到这一转变的不仅仅是 Brockman。世界各地的开发者们都注意到 AI 编程助手突然变得更加出色。这场主要围绕 Claude Code 展开的讨论,已经走出了硅谷,成为主流新闻。没有编程经验的普通人也开始着手开发定制软件项目。
使用量的激增并非偶然。在此期间,Anthropic 和 OpenAI 在获取 AI 编程助手新客户方面投入了巨资。几位开发者告诉 WIRED,他们每月 200 美元的 Codex 和 Claude Code 套餐,可以让他们获得超过 1000 美元的额度。这些慷慨的额度限制是一种让开发者在工作场所使用 AI 编程产品的方式,这样 OpenAI 和 Anthropic 就可以按使用量收费。
据知情人士透露,在 2025 年 9 月,Codex 的使用量仅为 Claude Code 的 5%。消息人士称,到 2026 年 1 月,Codex 的用户群已上升到 Claude Code 的 40% 左右。
George Pickett 是一位在科技初创公司工作了 10 年的开发者,他最近开始组织围绕 Codex 的聚会。“我认为很明显,我们将用代理来取代白领工作,” Pickett 说。“从社会角度来看,谁他妈知道这意味着什么。这将会是颠覆性的,但我对正在发生的事情相当乐观。”
价值 110 亿美元的生产力初创公司 Notion 的联合创始人 Simon Last 表示,他和他的顶尖工程师们在 GPT-5.2 发布后,在很大程度上出于可靠性原因转而使用 Codex。“我发现 Claude Code 总是欺骗我,” Last 说。“它说它在工作,但实际上并没有。”

Katy Shi, a researcher at OpenAI who works on model behavior.
Photograph: MARK JAYSON QUINES在 OpenAI 从事 Codex 行为研究的研究员 Katy Shi 表示,虽然有些人形容其默认的个性是“干面包”,但许多人已经开始欣赏其不那么奉承的风格。“很多工程工作在于能够接受批评性反馈而不将其视为恶意,” Shi 说。
几家大型企业也已签约使用 Codex。“ChatGPT 等同于 AI 这一事实,使我们在 B2B 市场拥有巨大的优势,” OpenAI 应用部门首席执行官 Fidji Simo 说。“公司希望使用其员工已经熟悉的技术。” Simo 表示,OpenAI 销售 Codex 的策略很大程度上是将其与 ChatGPT 和其他 OpenAI 产品打包销售。
思科总裁兼首席产品官 Jeetu Patel 表示,他已告知员工不要担心使用 Codex 的成本,因为他们需要熟悉该工具。当员工问“他们是否会因为使用这些工具而失业”时,Patel 说,“我们必须告诉我们的员工,不,但我保证如果你不使用它们,你就会失业,因为你将不再有竞争力。所以你会被淘汰。”
如今,围绕 AI 编程助手的恐慌已经远远超出了硅谷。《华尔街日报》将 Claude Code 归因于上个月导致了1 万亿美元的科技股抛售,因为投资者担心软件很快就会过时。几周后,在 Anthropic 宣布 Claude Code 可用于现代化改造 COBOL 遗留系统(IBM 机器上普遍使用)后,IBM 的股价经历了 25 年来的最糟糕一天。OpenAI 一直在不懈努力,使其 AI 编程助手成为社会对话的一部分,花费数百万美元在超级碗广告中宣传 Codex,而不是 ChatGPT。
在 Mission Bay 的圣殿里,没有人需要被推销 Codex。我采访过的许多 OpenAI 工程师表示,他们自己几乎不再敲代码了。他们整天都在与 Codex 交流。有时他们会聚集在一起,集体进行这项活动。
在总部,我参加了一场 Codex 黑客马拉松——大约有 100 名工程师挤在一个大房间里。每个人有四个小时的时间用 Codex 构建最好的演示。一位 OpenAI 高管站在房间前面,手里拿着笔记本电脑,一边扭动身体,一边通过麦克风念出团队的名字。团队代表紧张地走到讲台前,用颤抖的声音简短地介绍他们的 AI 项目。获胜者获得了 Patagonia 背包。
许多项目都是用 Codex 创建的,并且旨在帮助工程师更好地使用 Codex。一个小组构建了一个将 Slack 消息总结为每周报告的工具。另一小组构建了一个 AI 生成的、类似维基百科的内部 OpenAI 服务指南。其中许多演示以前需要花费数天或数周才能启动,但现在可以在一个下午完成。
在离开的时候,我遇到了 Kevin Weil,他曾是 Instagram 的高管,现在负责领导 OpenAI for Science,这是该公司为研究人员构建 AI 产品的新部门。他告诉我,Codex 正在为他做一些通宵项目,他将在早上查看。这已经成为 Weil 和数百名其他员工的常规做法。OpenAI 在 2026 年的目标之一是开发一个自动化的实习生,来研究(还能研究什么呢?)AI。
Simo 告诉我,该公司希望 Codex 最终能为 ChatGPT 和所有其产品中的功能提供支持——不是用于编程,而是为人们完成任务。Altman 表示,他很乐意发布一个通用版本的 Codex,但他担心安全问题。他说,一月份,他的一位非技术朋友请他设置 OpenClaw,一个病毒式的 AI 编程助手。Altman 告诉我他拒绝了,因为“目前这显然不是一个好主意”,因为 OpenClaw 可以删除重要文件。在 Altman 告诉我这些几周后,OpenAI 宣布它正在聘请 OpenClaw 的创建者。
我采访的许多开发者告诉我,Codex 和 Claude Code 之间的竞争从未如此激烈。但随着这些工具变得越来越强大——并且被寻求效率的企业领导者越来越广泛地强制使用——社会需要面对的问题比选择哪个编程助手更重大。

Amelia Glaese, OpenAI’s VP of research and head of alignment.
Photograph: MARK JAYSON QUINES一些监督机构担心,OpenAI 追赶 Claude Code 的竞赛会将安全问题置于次要地位。一个名为 Midas Project 的非营利组织指控 OpenAI 在 GPT-5.3-Codex 上放松了其安全承诺,未能恰当地概述该模型的网络安全风险。OpenAI 的对齐负责人 Amelia Glaese 反驳了安全被 Codex 所牺牲的说法,OpenAI 表示 Midas 误解了公司的承诺。
即使对于 Brockman 来说——他去年向支持 AI 的超级政治行动委员会和支持特朗普的政治行动委员会各捐赠了 2500 万美元,以推进 OpenAI 的使命,并愉快地说“我们正按计划”实现 AGI——新的现实也唤起了复杂的情感。在硅谷的工程师中,他一直以痴迷著称,是那种会在产品发布前夜深入代码库的老板。在很多方面,这种新的放手时代“非常自由,因为你意识到你的大脑负担了许多不必要的细节,”他说。然而,当你成为“这个由数十万代理组成的舰队的 CEO,它们正在完成你的目标、你的愿景”时,他说,“你就不再深入了解具体如何解决各种问题了。”在某些方面,Brockman 说,这种新的工作方式会让你“觉得你正在失去对问题的掌控感。”
在你的收件箱里
想了解来自硅谷 AI 中心地的报道,请订阅 Maxwell Zeff 的每周Model Behavior 时事通讯。
你的看法?
请在下方的评论区告诉我们您对本文的看法。或者,您也可以通过 mail@wired.com 提交给编辑的信件。
评论区